「cs.CV」カテゴリーアーカイブ

X-GRM: Large Gaussian Reconstruction Model for Sparse-view X-rays to Computed Tomography

投稿日: 2025年5月27日作成者: jarxiv

要約コンピューター断層撮影は、臨床ワークフローに不可欠なツールとして機能し、内 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Task-Oriented Communications for Visual Navigation with Edge-Aerial Collaboration in Low Altitude Economy

投稿日: 2025年5月27日作成者: jarxiv

要約低高度経済（LAE）をサポートするには、世界のポジショニングシステム（GP … 続きを読む →

カテゴリー: cs.CV, cs.NI | コメントを受け付けていません

AdaTP: Attention-Debiased Token Pruning for Video Large Language Models

投稿日: 2025年5月27日作成者: jarxiv

要約ビデオ大規模な言語モデル（ビデオLLM）は、ビデオ理解のタスクで顕著な結果 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

From Data to Modeling: Fully Open-vocabulary Scene Graph Generation

投稿日: 2025年5月27日作成者: jarxiv

要約従来のクローズドセットモデルの制限を克服する完全にオープンボキャブラリーシ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Refining Few-Step Text-to-Multiview Diffusion via Reinforcement Learning

投稿日: 2025年5月27日作成者: jarxiv

要約単一のテキストプロンプトからコヒーレントなマルチビュー画像を生成するテキス … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

MEBench: A Novel Benchmark for Understanding Mutual Exclusivity Bias in Vision-Language Models

投稿日: 2025年5月27日作成者: jarxiv

要約このペーパーでは、単語学習中に子供に観察される認知現象である相互排他性（M … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Understanding Generalization in Diffusion Models via Probability Flow Distance

投稿日: 2025年5月27日作成者: jarxiv

要約拡散モデルは、トレーニングデータを超えて一般化する高品質のサンプルを生成で … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Unsupervised Detection of Distribution Shift in Inverse Problems using Diffusion Models

投稿日: 2025年5月27日作成者: jarxiv

要約拡散モデルは、イメージングの逆の問題の事前に広く使用されています。ただし … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

TUNA: Comprehensive Fine-grained Temporal Understanding Evaluation on Dense Dynamic Videos

投稿日: 2025年5月27日作成者: jarxiv

要約ビデオは、カメラ、シーン、アクション、属性など、時間の経過とともに動的な関 … 続きを読む →

カテゴリー: cs.CV, cs.DB, cs.MM | コメントを受け付けていません

OB3D: A New Dataset for Benchmarking Omnidirectional 3D Reconstruction Using Blender

投稿日: 2025年5月27日作成者: jarxiv

要約神経放射輝度フィールド（NERF）と3Dガウスのスプラッティング（3DG） … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

X-GRM: Large Gaussian Reconstruction Model for Sparse-view X-rays to Computed Tomography

Task-Oriented Communications for Visual Navigation with Edge-Aerial Collaboration in Low Altitude Economy

AdaTP: Attention-Debiased Token Pruning for Video Large Language Models

From Data to Modeling: Fully Open-vocabulary Scene Graph Generation

Refining Few-Step Text-to-Multiview Diffusion via Reinforcement Learning

MEBench: A Novel Benchmark for Understanding Mutual Exclusivity Bias in Vision-Language Models

Understanding Generalization in Diffusion Models via Probability Flow Distance

Unsupervised Detection of Distribution Shift in Inverse Problems using Diffusion Models

TUNA: Comprehensive Fine-grained Temporal Understanding Evaluation on Dense Dynamic Videos

OB3D: A New Dataset for Benchmarking Omnidirectional 3D Reconstruction Using Blender

最近の投稿

最近のコメント

アーカイブ

カテゴリー