「cs.AI」カテゴリーアーカイブ

Emergence of Fixational and Saccadic Movements in a Multi-Level Recurrent Attention Model for Vision

投稿日: 2025年5月20日作成者: jarxiv

要約中心のビジョンに触発されたハードオーテストモデルは、解釈性とパラメーター経 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

MatPredict: a dataset and benchmark for learning material properties of diverse indoor objects

投稿日: 2025年5月20日作成者: jarxiv

要約カメラ画像から材料特性を決定することで、屋内環境で複雑なオブジェクトを識別 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

MAGI-1: Autoregressive Video Generation at Scale

投稿日: 2025年5月20日作成者: jarxiv

要約連続したフレームの固定長セグメントとして定義された一連のビデオチャンクを自 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Scaling Computer-Use Grounding via User Interface Decomposition and Synthesis

投稿日: 2025年5月20日作成者: jarxiv

要約グラフィカルユーザーインターフェイス（GUI）の接地、グラフィカルユーザー … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.HC | コメントを受け付けていません

StarFT: Robust Fine-tuning of Zero-shot Models via Spuriosity Alignment

投稿日: 2025年5月20日作成者: jarxiv

要約データからの堅牢な表現を学習するには、多くの場合、スケールが必要であり、ク … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Captured by Captions: On Memorization and its Mitigation in CLIP Models

投稿日: 2025年5月20日作成者: jarxiv

要約クリップなどのマルチモーダルモデルは、画像検索やゼロショット分類などのタス … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

JetFormer: An Autoregressive Generative Model of Raw Images and Text

投稿日: 2025年5月20日作成者: jarxiv

要約モデリングの制約を削除し、ドメイン全体でアーキテクチャを統合することは、大 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Quantifying Context Bias in Domain Adaptation for Object Detection

投稿日: 2025年5月20日作成者: jarxiv

要約オブジェクト検出のためのドメイン適応（DAOD）は、訓練されたモデルをソー … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

RBF++: Quantifying and Optimizing Reasoning Boundaries across Measurable and Unmeasurable Capabilities for Chain-of-Thought Reasoning

投稿日: 2025年5月20日作成者: jarxiv

要約チェーンオブテーブ（COT）の推論は、複雑なタスクの大規模な言語モデル（L … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Denoising Diffusion Probabilistic Model for Point Cloud Compression at Low Bit-Rates

投稿日: 2025年5月20日作成者: jarxiv

要約帯域幅に制約のあるアプリケーションにとって、低ビット率雲の効率的な圧縮が重 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Emergence of Fixational and Saccadic Movements in a Multi-Level Recurrent Attention Model for Vision

MatPredict: a dataset and benchmark for learning material properties of diverse indoor objects

MAGI-1: Autoregressive Video Generation at Scale

Scaling Computer-Use Grounding via User Interface Decomposition and Synthesis

StarFT: Robust Fine-tuning of Zero-shot Models via Spuriosity Alignment

Captured by Captions: On Memorization and its Mitigation in CLIP Models

JetFormer: An Autoregressive Generative Model of Raw Images and Text

Quantifying Context Bias in Domain Adaptation for Object Detection

RBF++: Quantifying and Optimizing Reasoning Boundaries across Measurable and Unmeasurable Capabilities for Chain-of-Thought Reasoning

Denoising Diffusion Probabilistic Model for Point Cloud Compression at Low Bit-Rates

最近の投稿

最近のコメント

アーカイブ

カテゴリー