UniTeam: Open Vocabulary Mobile Manipulation Challenge

要約

このレポートでは、「HomeRobot: Open Vocabulary Mobile Manipulation」チャレンジの改良されたベースラインである UniTeam エージェントを紹介します。
この課題は、不慣れな環境でのナビゲーション、新しいオブジェクトの操作、オープン語彙オブジェクト クラスの認識という問題を引き起こします。
この課題は、機械学習、コンピューター ビジョン、自然言語、ロボット工学における最近の進歩を利用して、身体化された AI における横断的な研究を促進することを目的としています。
この作業では、提供されたベースライン エージェントの徹底的な評価を実施しました。
認識、ナビゲーション、および操作スキルの欠陥が特定されました。
ベースライン エージェントのパフォーマンスが向上しました。
特に、認識が強化され、誤分類が最小限に抑えられました。
ナビゲーション – 無限ループコミットメントを防止します。
ピッキング – オブジェクトの可視性の変化による失敗に対処します。
配置 – オブジェクトを正しく配置するために正確な位置を確保します。

要約(オリジナル)

This report introduces our UniTeam agent – an improved baseline for the ‘HomeRobot: Open Vocabulary Mobile Manipulation’ challenge. The challenge poses problems of navigation in unfamiliar environments, manipulation of novel objects, and recognition of open-vocabulary object classes. This challenge aims to facilitate cross-cutting research in embodied AI using recent advances in machine learning, computer vision, natural language, and robotics. In this work, we conducted an exhaustive evaluation of the provided baseline agent; identified deficiencies in perception, navigation, and manipulation skills; and improved the baseline agent’s performance. Notably, enhancements were made in perception – minimizing misclassifications; navigation – preventing infinite loop commitments; picking – addressing failures due to changing object visibility; and placing – ensuring accurate positioning for successful object placement.

arxiv情報

著者 Andrew Melnik,Michael Büttner,Leon Harz,Lyon Brown,Gora Chand Nandi,Arjun PS,Gaurav Kumar Yadav,Rahul Kala,Robert Haschke
発行日 2023-12-14 02:24:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク