月別アーカイブ: 2025年4月

Revisiting Data Auditing in Large Vision-Language Models

投稿日: 2025年4月28日作成者: jarxiv

要約大規模な言語モデル（LLMS）の急増により、視覚的接地を正確に視覚的に接地 … 続きを読む →

カテゴリー: cs.CR, cs.CV | コメントを受け付けていません

Interpretable Affordance Detection on 3D Point Clouds with Probabilistic Prototypes

投稿日: 2025年4月28日作成者: jarxiv

要約ロボットエージェントは、自律的に、また人間とロボットの相互作用中に、環境で … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

COCO-Inpaint: A Benchmark for Image Inpainting Detection and Manipulation Localization

投稿日: 2025年4月28日作成者: jarxiv

要約画像操作における最近の進歩は、フォトリアリスティックコンテンツの生成におい … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

L4P: Low-Level 4D Vision Perception Unified

投稿日: 2025年4月28日作成者: jarxiv

要約ビデオのピクセル間の時空間的関係は、低レベルの4D認識タスクの重要な情報を … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Unsupervised Visual Chain-of-Thought Reasoning via Preference Optimization

投稿日: 2025年4月28日作成者: jarxiv

要約チェーンオブサブ（COT）の推論により、マルチモーダル大手言語モデル（ML … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Partition Map-Based Fast Block Partitioning for VVC Inter Coding

投稿日: 2025年4月28日作成者: jarxiv

要約多用途のビデオコーディング（VVC）の新しい手法の中で、ネストされたマルチ … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

A Multimodal Deep Learning Approach for White Matter Shape Prediction in Diffusion MRI Tractography

投稿日: 2025年4月28日作成者: jarxiv

要約形状の測定は、白質トラクトグラフィーの有望な記述子として浮上しており、認知 … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.IV | コメントを受け付けていません

HepatoGEN: Generating Hepatobiliary Phase MRI with Perceptual and Adversarial Models

投稿日: 2025年4月28日作成者: jarxiv

要約動的コントラスト強化磁気共鳴画像（DCE-MRI）は、焦点肝病変の検出と特 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Instant Policy: In-Context Imitation Learning via Graph Diffusion

投稿日: 2025年4月28日作成者: jarxiv

要約大型トランスを使用したコンテキスト内学習の印象的な能力に従って、コンテキス … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Skywork R1V2: Multimodal Hybrid Reinforcement Learning for Reasoning

投稿日: 2025年4月28日作成者: jarxiv

要約次世代のマルチモーダル推論モデルであるSkywork R1v2と、その前身 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2025年4月

Revisiting Data Auditing in Large Vision-Language Models

Interpretable Affordance Detection on 3D Point Clouds with Probabilistic Prototypes

COCO-Inpaint: A Benchmark for Image Inpainting Detection and Manipulation Localization

L4P: Low-Level 4D Vision Perception Unified

Unsupervised Visual Chain-of-Thought Reasoning via Preference Optimization

Partition Map-Based Fast Block Partitioning for VVC Inter Coding

A Multimodal Deep Learning Approach for White Matter Shape Prediction in Diffusion MRI Tractography

HepatoGEN: Generating Hepatobiliary Phase MRI with Perceptual and Adversarial Models

Instant Policy: In-Context Imitation Learning via Graph Diffusion

Skywork R1V2: Multimodal Hybrid Reinforcement Learning for Reasoning

最近の投稿

最近のコメント

アーカイブ

カテゴリー