cs.CV」カテゴリーアーカイブ

Equivariant Image Modeling

要約 自己回帰や拡散アプローチなどの現在の生成モデルは、高次元データ分布学習を一 … 続きを読む

カテゴリー: cs.CV | Equivariant Image Modeling はコメントを受け付けていません

Target-Aware Video Diffusion Models

要約 ターゲットが認識しているビデオ拡散モデルを提示します。これは、俳優が目的の … 続きを読む

カテゴリー: cs.CV | Target-Aware Video Diffusion Models はコメントを受け付けていません

Depth Matters: Multimodal RGB-D Perception for Robust Autonomous Agents

要約 リアルタイムの制御決定を行うために純粋に認識に依存する自律エージェントは、 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Depth Matters: Multimodal RGB-D Perception for Robust Autonomous Agents はコメントを受け付けていません

3D-GRAND: A Million-Scale Dataset for 3D-LLMs with Better Grounding and Less Hallucination

要約 言語の統合と3D認識は、物理的な世界を理解し、相互作用する具体化されたエー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | 3D-GRAND: A Million-Scale Dataset for 3D-LLMs with Better Grounding and Less Hallucination はコメントを受け付けていません

SGFormer: Satellite-Ground Fusion for 3D Semantic Scene Completion

要約 最近、カメラベースのソリューションがシーンセマンティック完了(SSC)につ … 続きを読む

カテゴリー: cs.CV, cs.RO | SGFormer: Satellite-Ground Fusion for 3D Semantic Scene Completion はコメントを受け付けていません

An Integrated Approach to Robotic Object Grasping and Manipulation

要約 倉庫運用の肉体労働と効率性の増大する課題に対応して、Amazonは、さまざ … 続きを読む

カテゴリー: cs.CV, cs.RO | An Integrated Approach to Robotic Object Grasping and Manipulation はコメントを受け付けていません

HOTFormerLoc: Hierarchical Octree Transformer for Versatile Lidar Place Recognition Across Ground and Aerial Views

要約 都市部と森林環境全体の地上から地面から地上から天の両方のシナリオで、大規模 … 続きを読む

カテゴリー: cs.CV, cs.RO | HOTFormerLoc: Hierarchical Octree Transformer for Versatile Lidar Place Recognition Across Ground and Aerial Views はコメントを受け付けていません

Efficient Training of Generalizable Visuomotor Policies via Control-Aware Augmentation

要約 一般化の改善は、具体化されたAIの重要な課題の1つです。この場合、多様なシ … 続きを読む

カテゴリー: cs.CV, cs.RO | Efficient Training of Generalizable Visuomotor Policies via Control-Aware Augmentation はコメントを受け付けていません

HAPI: A Model for Learning Robot Facial Expressions from Human Preferences

要約 固定された関節構成に基づいた手作りの方法が硬く不自然な行動をもたらすことが … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC, cs.LG, cs.RO | HAPI: A Model for Learning Robot Facial Expressions from Human Preferences はコメントを受け付けていません

GAA-TSO: Geometry-Aware Assisted Depth Completion for Transparent and Specular Objects

要約 透明で鏡面のオブジェクトは、日常生活、工場、研究所で頻繁に遭遇します。 た … 続きを読む

カテゴリー: cs.CV, cs.RO | GAA-TSO: Geometry-Aware Assisted Depth Completion for Transparent and Specular Objects はコメントを受け付けていません