cs.CV」カテゴリーアーカイブ

X-GRM: Large Gaussian Reconstruction Model for Sparse-view X-rays to Computed Tomography

要約 コンピューター断層撮影は、臨床ワークフローに不可欠なツールとして機能し、内 … 続きを読む

カテゴリー: cs.CV, eess.IV | X-GRM: Large Gaussian Reconstruction Model for Sparse-view X-rays to Computed Tomography はコメントを受け付けていません

Task-Oriented Communications for Visual Navigation with Edge-Aerial Collaboration in Low Altitude Economy

要約 低高度経済(LAE)をサポートするには、世界のポジショニングシステム(GP … 続きを読む

カテゴリー: cs.CV, cs.NI | Task-Oriented Communications for Visual Navigation with Edge-Aerial Collaboration in Low Altitude Economy はコメントを受け付けていません

AdaTP: Attention-Debiased Token Pruning for Video Large Language Models

要約 ビデオ大規模な言語モデル(ビデオLLM)は、ビデオ理解のタスクで顕著な結果 … 続きを読む

カテゴリー: cs.AI, cs.CV | AdaTP: Attention-Debiased Token Pruning for Video Large Language Models はコメントを受け付けていません

From Data to Modeling: Fully Open-vocabulary Scene Graph Generation

要約 従来のクローズドセットモデルの制限を克服する完全にオープンボキャブラリーシ … 続きを読む

カテゴリー: cs.CV | From Data to Modeling: Fully Open-vocabulary Scene Graph Generation はコメントを受け付けていません

Refining Few-Step Text-to-Multiview Diffusion via Reinforcement Learning

要約 単一のテキストプロンプトからコヒーレントなマルチビュー画像を生成するテキス … 続きを読む

カテゴリー: cs.CV, cs.LG | Refining Few-Step Text-to-Multiview Diffusion via Reinforcement Learning はコメントを受け付けていません

MEBench: A Novel Benchmark for Understanding Mutual Exclusivity Bias in Vision-Language Models

要約 このペーパーでは、単語学習中に子供に観察される認知現象である相互排他性(M … 続きを読む

カテゴリー: cs.CV | MEBench: A Novel Benchmark for Understanding Mutual Exclusivity Bias in Vision-Language Models はコメントを受け付けていません

Understanding Generalization in Diffusion Models via Probability Flow Distance

要約 拡散モデルは、トレーニングデータを超えて一般化する高品質のサンプルを生成で … 続きを読む

カテゴリー: cs.CV, cs.LG | Understanding Generalization in Diffusion Models via Probability Flow Distance はコメントを受け付けていません

Unsupervised Detection of Distribution Shift in Inverse Problems using Diffusion Models

要約 拡散モデルは、イメージングの逆の問題の事前に広く使用されています。 ただし … 続きを読む

カテゴリー: cs.CV | Unsupervised Detection of Distribution Shift in Inverse Problems using Diffusion Models はコメントを受け付けていません

TUNA: Comprehensive Fine-grained Temporal Understanding Evaluation on Dense Dynamic Videos

要約 ビデオは、カメラ、シーン、アクション、属性など、時間の経過とともに動的な関 … 続きを読む

カテゴリー: cs.CV, cs.DB, cs.MM | TUNA: Comprehensive Fine-grained Temporal Understanding Evaluation on Dense Dynamic Videos はコメントを受け付けていません

OB3D: A New Dataset for Benchmarking Omnidirectional 3D Reconstruction Using Blender

要約 神経放射輝度フィールド(NERF)と3Dガウスのスプラッティング(3DG) … 続きを読む

カテゴリー: cs.CV | OB3D: A New Dataset for Benchmarking Omnidirectional 3D Reconstruction Using Blender はコメントを受け付けていません