月別アーカイブ: 2025年4月

Revisiting Data Auditing in Large Vision-Language Models

要約 大規模な言語モデル(LLMS)の急増により、視覚的接地を正確に視覚的に接地 … 続きを読む

カテゴリー: cs.CR, cs.CV | Revisiting Data Auditing in Large Vision-Language Models はコメントを受け付けていません

Interpretable Affordance Detection on 3D Point Clouds with Probabilistic Prototypes

要約 ロボットエージェントは、自律的に、また人間とロボットの相互作用中に、環境で … 続きを読む

カテゴリー: cs.CV, cs.RO | Interpretable Affordance Detection on 3D Point Clouds with Probabilistic Prototypes はコメントを受け付けていません

COCO-Inpaint: A Benchmark for Image Inpainting Detection and Manipulation Localization

要約 画像操作における最近の進歩は、フォトリアリスティックコンテンツの生成におい … 続きを読む

カテゴリー: cs.AI, cs.CV | COCO-Inpaint: A Benchmark for Image Inpainting Detection and Manipulation Localization はコメントを受け付けていません

L4P: Low-Level 4D Vision Perception Unified

要約 ビデオのピクセル間の時空間的関係は、低レベルの4D認識タスクの重要な情報を … 続きを読む

カテゴリー: cs.CV | L4P: Low-Level 4D Vision Perception Unified はコメントを受け付けていません

Unsupervised Visual Chain-of-Thought Reasoning via Preference Optimization

要約 チェーンオブサブ(COT)の推論により、マルチモーダル大手言語モデル(ML … 続きを読む

カテゴリー: cs.CV | Unsupervised Visual Chain-of-Thought Reasoning via Preference Optimization はコメントを受け付けていません

Partition Map-Based Fast Block Partitioning for VVC Inter Coding

要約 多用途のビデオコーディング(VVC)の新しい手法の中で、ネストされたマルチ … 続きを読む

カテゴリー: cs.CV, eess.IV | Partition Map-Based Fast Block Partitioning for VVC Inter Coding はコメントを受け付けていません

A Multimodal Deep Learning Approach for White Matter Shape Prediction in Diffusion MRI Tractography

要約 形状の測定は、白質トラクトグラフィーの有望な記述子として浮上しており、認知 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | A Multimodal Deep Learning Approach for White Matter Shape Prediction in Diffusion MRI Tractography はコメントを受け付けていません

HepatoGEN: Generating Hepatobiliary Phase MRI with Perceptual and Adversarial Models

要約 動的コントラスト強化磁気共鳴画像(DCE-MRI)は、焦点肝病変の検出と特 … 続きを読む

カテゴリー: cs.CV, eess.IV | HepatoGEN: Generating Hepatobiliary Phase MRI with Perceptual and Adversarial Models はコメントを受け付けていません

Instant Policy: In-Context Imitation Learning via Graph Diffusion

要約 大型トランスを使用したコンテキスト内学習の印象的な能力に従って、コンテキス … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Instant Policy: In-Context Imitation Learning via Graph Diffusion はコメントを受け付けていません

Skywork R1V2: Multimodal Hybrid Reinforcement Learning for Reasoning

要約 次世代のマルチモーダル推論モデルであるSkywork R1v2と、その前身 … 続きを読む

カテゴリー: cs.CV | Skywork R1V2: Multimodal Hybrid Reinforcement Learning for Reasoning はコメントを受け付けていません