cs.AI」カテゴリーアーカイブ

Emergence of Fixational and Saccadic Movements in a Multi-Level Recurrent Attention Model for Vision

要約 中心のビジョンに触発されたハードオーテストモデルは、解釈性とパラメーター経 … 続きを読む

カテゴリー: cs.AI, cs.CV | Emergence of Fixational and Saccadic Movements in a Multi-Level Recurrent Attention Model for Vision はコメントを受け付けていません

MatPredict: a dataset and benchmark for learning material properties of diverse indoor objects

要約 カメラ画像から材料特性を決定することで、屋内環境で複雑なオブジェクトを識別 … 続きを読む

カテゴリー: cs.AI, cs.CV | MatPredict: a dataset and benchmark for learning material properties of diverse indoor objects はコメントを受け付けていません

MAGI-1: Autoregressive Video Generation at Scale

要約 連続したフレームの固定長セグメントとして定義された一連のビデオチャンクを自 … 続きを読む

カテゴリー: cs.AI, cs.CV | MAGI-1: Autoregressive Video Generation at Scale はコメントを受け付けていません

Scaling Computer-Use Grounding via User Interface Decomposition and Synthesis

要約 グラフィカルユーザーインターフェイス(GUI)の接地、グラフィカルユーザー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.HC | Scaling Computer-Use Grounding via User Interface Decomposition and Synthesis はコメントを受け付けていません

StarFT: Robust Fine-tuning of Zero-shot Models via Spuriosity Alignment

要約 データからの堅牢な表現を学習するには、多くの場合、スケールが必要であり、ク … 続きを読む

カテゴリー: cs.AI, cs.CV | StarFT: Robust Fine-tuning of Zero-shot Models via Spuriosity Alignment はコメントを受け付けていません

Captured by Captions: On Memorization and its Mitigation in CLIP Models

要約 クリップなどのマルチモーダルモデルは、画像検索やゼロショット分類などのタス … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Captured by Captions: On Memorization and its Mitigation in CLIP Models はコメントを受け付けていません

JetFormer: An Autoregressive Generative Model of Raw Images and Text

要約 モデリングの制約を削除し、ドメイン全体でアーキテクチャを統合することは、大 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | JetFormer: An Autoregressive Generative Model of Raw Images and Text はコメントを受け付けていません

Quantifying Context Bias in Domain Adaptation for Object Detection

要約 オブジェクト検出のためのドメイン適応(DAOD)は、訓練されたモデルをソー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Quantifying Context Bias in Domain Adaptation for Object Detection はコメントを受け付けていません

RBF++: Quantifying and Optimizing Reasoning Boundaries across Measurable and Unmeasurable Capabilities for Chain-of-Thought Reasoning

要約 チェーンオブテーブ(COT)の推論は、複雑なタスクの大規模な言語モデル(L … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | RBF++: Quantifying and Optimizing Reasoning Boundaries across Measurable and Unmeasurable Capabilities for Chain-of-Thought Reasoning はコメントを受け付けていません

Denoising Diffusion Probabilistic Model for Point Cloud Compression at Low Bit-Rates

要約 帯域幅に制約のあるアプリケーションにとって、低ビット率雲の効率的な圧縮が重 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Denoising Diffusion Probabilistic Model for Point Cloud Compression at Low Bit-Rates はコメントを受け付けていません