cs.RO」カテゴリーアーカイブ

Resource-Efficient Affordance Grounding with Complementary Depth and Semantic Prompts

要約 アフォーダンスとは、エージェントが環境から認識し、利用する機能特性を指し、 … 続きを読む

カテゴリー: cs.CV, cs.RO, eess.IV | コメントする

Class-Aware PillarMix: Can Mixed Sample Data Augmentation Enhance 3D Object Detection with Radar Point Clouds?

要約 3D認識タスクでのデータ収集と注釈に必要な努力により、既存のデータを混合す … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントする

Deep Learning-Enhanced Visual Monitoring in Hazardous Underwater Environments with a Swarm of Micro-Robots

要約 水中貯蔵施設などの極端な環境の長期的な監視と調査は、費用がかかり、労働集約 … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする

A Survey on Vision-Language-Action Models for Embodied AI

要約 具体化されたAIは、物理世界でタスクを実行するために具体化されたエージェン … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.RO | コメントする

3D-AffordanceLLM: Harnessing Large Language Models for Open-Vocabulary Affordance Detection in 3D Worlds

要約 3Dアフォーダンス検出は、さまざまなロボットタスクに関する幅広いアプリケー … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする

3D-AffordanceLLM: Harnessing Large Language Models for Open-Vocabulary Affordance Detection in 3D Worlds

要約 3Dアフォーダンス検出は、さまざまなロボットタスクに関する幅広いアプリケー … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする

Towards Generalizable Vision-Language Robotic Manipulation: A Benchmark and LLM-guided 3D Policy

要約 言語条件付きロボット操作ポリシーを新しいタスクに汎化することは、適切なシミ … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする

Haptic-ACT: Bridging Human Intuition with Compliant Robotic Manipulation via Immersive VR

要約 ロボットの操作は、産業や家庭でのロボットの普及に不可欠なものであり、ロボッ … 続きを読む

カテゴリー: cs.RO | コメントする

Task-Aware Robotic Grasping by evaluating Quality Diversity Solutions through Foundation Models

要約 タスクを考慮したロボット把持は、意味理解と幾何学的推論の統合を必要とする困 … 続きを読む

カテゴリー: cs.RO | コメントする

VDT-Auto: End-to-end Autonomous Driving with VLM-Guided Diffusion Transformers

要約 自律走行では、動的環境やコーナーケースが、自車両の意思決定のロバスト性に大 … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする