要約
LLM の最近の進歩は、広範囲のタスクやシナリオを理解して推論するための膨大な一般知識と能力を活用することにより、自律ロボット制御と人間とロボットの相互作用に役立っています。
これまでの研究では、タスクを達成するための \glspl{LLM} のパフォーマンスを向上させるためのさまざまなプロンプト エンジニアリング手法が研究されてきましたが、他の研究では、LLM を利用して、特定のロボット プラットフォームで利用可能な機能に基づいてタスクを計画および実行する方法が提案されてきました。
この研究では、サービス ロボティクスにおける高レベルのタスク計画と実行のアプリケーションにおけるプロンプト エンジニアリング技術とその組み合わせを比較することで、両方の研究分野について検討します。
私たちは、シミュレーションで多様なタスクのセットとシンプルな機能のセットを定義し、いくつかの最先端のモデルについてタスクの完了精度と実行時間を測定します。
要約(オリジナル)
Recent advances in LLM have been instrumental in autonomous robot control and human-robot interaction by leveraging their vast general knowledge and capabilities to understand and reason across a wide range of tasks and scenarios. Previous works have investigated various prompt engineering techniques for improving the performance of \glspl{LLM} to accomplish tasks, while others have proposed methods that utilize LLMs to plan and execute tasks based on the available functionalities of a given robot platform. In this work, we consider both lines of research by comparing prompt engineering techniques and combinations thereof within the application of high-level task planning and execution in service robotics. We define a diverse set of tasks and a simple set of functionalities in simulation, and measure task completion accuracy and execution time for several state-of-the-art models.
arxiv情報
著者 | Jonas Bode,Bastian Pätzold,Raphael Memmesheimer,Sven Behnke |
発行日 | 2024-10-30 13:22:55+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google