要約
このレポートでは、「HomeRobot: Open Vocabulary Mobile Manipulation」チャレンジの改良されたベースラインである UniTeam エージェントを紹介します。
この課題は、不慣れな環境でのナビゲーション、新しいオブジェクトの操作、オープン語彙オブジェクト クラスの認識という問題を引き起こします。
この課題は、機械学習、コンピューター ビジョン、自然言語、ロボット工学における最近の進歩を利用して、身体化された AI における横断的な研究を促進することを目的としています。
この作業では、提供されたベースライン エージェントの徹底的な評価を実施しました。
認識、ナビゲーション、および操作スキルの欠陥が特定されました。
ベースライン エージェントのパフォーマンスが向上しました。
特に、認識が強化され、誤分類が最小限に抑えられました。
ナビゲーション – 無限ループコミットメントを防止します。
ピッキング – オブジェクトの可視性の変化による失敗に対処します。
配置 – オブジェクトを正しく配置するために正確な位置を確保します。
要約(オリジナル)
This report introduces our UniTeam agent – an improved baseline for the ‘HomeRobot: Open Vocabulary Mobile Manipulation’ challenge. The challenge poses problems of navigation in unfamiliar environments, manipulation of novel objects, and recognition of open-vocabulary object classes. This challenge aims to facilitate cross-cutting research in embodied AI using recent advances in machine learning, computer vision, natural language, and robotics. In this work, we conducted an exhaustive evaluation of the provided baseline agent; identified deficiencies in perception, navigation, and manipulation skills; and improved the baseline agent’s performance. Notably, enhancements were made in perception – minimizing misclassifications; navigation – preventing infinite loop commitments; picking – addressing failures due to changing object visibility; and placing – ensuring accurate positioning for successful object placement.
arxiv情報
著者 | Andrew Melnik,Michael Büttner,Leon Harz,Lyon Brown,Gora Chand Nandi,Arjun PS,Gaurav Kumar Yadav,Rahul Kala,Robert Haschke |
発行日 | 2023-12-14 02:24:29+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google