「cs.CV」カテゴリーアーカイブ

ManipTrans: Efficient Dexterous Bimanual Manipulation Transfer via Residual Learning

投稿日: 2025年3月31日作成者: jarxiv

要約人間の手は相互作用する上で中心的な役割を果たし、器用なロボット操作の増加す … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Multimodal Object Detection using Depth and Image Data for Manufacturing Parts

投稿日: 2025年3月31日作成者: jarxiv

要約製造には、多様な種類の製造部品とコンポーネントの正確なピッキングと取り扱い … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

VidBot: Learning Generalizable 3D Actions from In-the-Wild 2D Human Videos for Zero-Shot Robotic Manipulation

投稿日: 2025年3月31日作成者: jarxiv

要約将来のロボットは、さまざまな家庭用タスクを実行できる多目的システムとして想 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

CoT-VLA: Visual Chain-of-Thought Reasoning for Vision-Language-Action Models

投稿日: 2025年3月31日作成者: jarxiv

要約 Vision-Language-actionモデル（VLA）は、一般化可能 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Deep Depth Estimation from Thermal Image: Dataset, Benchmark, and Challenges

投稿日: 2025年3月31日作成者: jarxiv

要約悪天候や照明条件の下で堅牢で正確な空間認識を達成することは、自動運転車やロ … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

REMAC: Self-Reflective and Self-Evolving Multi-Agent Collaboration for Long-Horizon Robot Manipulation

投稿日: 2025年3月31日作成者: jarxiv

要約 Vision-Language Models（VLMS）は、特にタスク分解 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.RO | コメントを受け付けていません

3D Acetabular Surface Reconstruction from 2D Pre-operative X-ray Images using SRVF Elastic Registration and Deformation Graph

投稿日: 2025年3月31日作成者: jarxiv

要約適切な寛骨臼カップサイズの正確で信頼できる選択は、全股関節形成術（THA） … 続きを読む →

カテゴリー: cs.CV, cs.RO, eess.IV | コメントを受け付けていません

SkillMimic: Learning Basketball Interaction Skills from Demonstrations

投稿日: 2025年3月31日作成者: jarxiv

要約人間とオブジェクトの相互作用のための従来の強化学習方法（HOI）は、さまざ … 続きを読む →

カテゴリー: cs.CV, cs.GR, cs.LG, cs.RO | コメントを受け付けていません

Learning to Instruct for Visual Instruction Tuning

投稿日: 2025年3月31日作成者: jarxiv

要約視覚指導のチューニング（VIT）の進歩であるLITを提案します。 VITは … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

VinaBench: Benchmark for Faithful and Consistent Visual Narratives

投稿日: 2025年3月31日作成者: jarxiv

要約視覚的な物語の生成は、テキストの物語をテキストの内容を示す画像のシーケンス … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

ManipTrans: Efficient Dexterous Bimanual Manipulation Transfer via Residual Learning

Multimodal Object Detection using Depth and Image Data for Manufacturing Parts

VidBot: Learning Generalizable 3D Actions from In-the-Wild 2D Human Videos for Zero-Shot Robotic Manipulation

CoT-VLA: Visual Chain-of-Thought Reasoning for Vision-Language-Action Models

Deep Depth Estimation from Thermal Image: Dataset, Benchmark, and Challenges

REMAC: Self-Reflective and Self-Evolving Multi-Agent Collaboration for Long-Horizon Robot Manipulation

3D Acetabular Surface Reconstruction from 2D Pre-operative X-ray Images using SRVF Elastic Registration and Deformation Graph

SkillMimic: Learning Basketball Interaction Skills from Demonstrations

Learning to Instruct for Visual Instruction Tuning

VinaBench: Benchmark for Faithful and Consistent Visual Narratives

最近の投稿

最近のコメント

アーカイブ

カテゴリー