投稿者「jarxiv」のアーカイブ

Can Pretrained Vision-Language Embeddings Alone Guide Robot Navigation?

要約 ファンデーションモデルは、タスク固有のトレーニングなしで豊富なセマンティッ … 続きを読む

カテゴリー: cs.RO | コメントする

AssistantX: An LLM-Powered Proactive Assistant in Collaborative Human-Populated Environment

要約 現在のサービスロボットは、限られた自然言語コミュニケーション能力、事前定義 … 続きを読む

カテゴリー: cs.AI, cs.MA, cs.RO | コメントする

NetRoller: Interfacing General and Specialized Models for End-to-End Autonomous Driving

要約 大規模な言語モデル(LLM)などの一般的なモデル(GM)を統合すると、自律 … 続きを読む

カテゴリー: cs.RO | コメントする

Latent Action Diffusion for Cross-Embodiment Manipulation

要約 エンドツーエンドの学習アプローチは、ロボット操作の大きな可能性を提供します … 続きを読む

カテゴリー: cs.RO | コメントする

Factor-Graph-Based Passive Acoustic Navigation for Decentralized Cooperative Localization Using Bearing Elevation Depth Difference

要約 正確でスケーラブルな水中マルチエージェントのローカリゼーションは、水中通信 … 続きを読む

カテゴリー: cs.RO | コメントする

AGENTSAFE: Benchmarking the Safety of Embodied Agents on Hazardous Instructions

要約 ビジョン言語モデル(VLM)の急速な進歩と具体化されたエージェントへの統合 … 続きを読む

カテゴリー: cs.CR, cs.RO | コメントする

LBAP: Improved Uncertainty Alignment of LLM Planners using Bayesian Inference

要約 大規模な言語モデル(LLMS)は、インテリジェントで役立つロボットの多くの … 続きを読む

カテゴリー: cs.RO | コメントする

Tactile Beyond Pixels: Multisensory Touch Representations for Robot Manipulation

要約 画像、音声、モーション、圧力の4つの触覚モダリティにわたる最初の多感覚タッ … 続きを読む

カテゴリー: cs.RO | コメントする

RobotSmith: Generative Robotic Tool Design for Acquisition of Complex Manipulation Skills

要約 ツールデザインの能力を備えたロボットを支えることは、そうでなければ手に負え … 続きを読む

カテゴリー: cs.RO | コメントする

GMT: General Motion Tracking for Humanoid Whole-Body Control

要約 現実の世界で全身の一般的な動きを追跡する能力は、一般的なヒューマノイドロボ … 続きを読む

カテゴリー: cs.RO | コメントする