要約
最近の大規模な言語モデル(LLM)は、ロボットアクションを計画することができます。
この論文では、状況的な人間とロボットの相互作用(HRI)を含むタスクでアクションを計画するためにLLMを使用する方法を探ります。
状況的HRIでLLMを適用する重要な問題は、「現在の人間の活動を尊重する」と「ロボットのタスクの優先順位付け」のバランスをとることと、LLMを使用してアクションプランを生成するタイミングを理解することです。
この論文では、上記の問題を解決するために必要な計画とアクションのスキル設計を提案します。
ロボットがパッシブ /アクティブな相互作用動作を切り替えることを可能にするための重要な要因は、現在のロボットのアクションに関するアクションテキストをLLMに提供することであることを示します。
また、適切なタイミングでアクションを計画するためには、LLMへの第2段階の質問(LLMを呼び出す次のタイミングについて)が必要であることを示します。
スキルデザインはエンゲージスキルに適用され、4つの異なるインタラクションシナリオでテストされます。
スキルデザインを使用することにより、LLMSを活用して、テストシナリオで合理的な成功率が90%に達するため、異なるHRIシナリオに簡単にスケーリングできることを示します。
要約(オリジナル)
Recent large language models (LLMs) are capable of planning robot actions. In this paper, we explore how LLMs can be used for planning actions with tasks involving situational human-robot interaction (HRI). A key problem of applying LLMs in situational HRI is balancing between ‘respecting the current human’s activity’ and ‘prioritizing the robot’s task,’ as well as understanding the timing of when to use the LLM to generate an action plan. In this paper, we propose a necessary plan-and-act skill design to solve the above problems. We show that a critical factor for enabling a robot to switch between passive / active interaction behavior is to provide the LLM with an action text about the current robot’s action. We also show that a second-stage question to the LLM (about the next timing to call the LLM) is necessary for planning actions at an appropriate timing. The skill design is applied to an Engage skill and is tested on four distinct interaction scenarios. We show that by using the skill design, LLMs can be leveraged to easily scale to different HRI scenarios with a reasonable success rate reaching 90% on the test scenarios.
arxiv情報
著者 | Kazuhiro Sasabuchi,Naoki Wake,Atsushi Kanehira,Jun Takamatsu,Katsushi Ikeuchi |
発行日 | 2025-04-01 23:41:05+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google