要約
実世界において多様なユーザーグループとの自然で直感的なインタラクションを促進するためには、ソーシャルロボットは、ユーザーからのフィードバックに基づいて行動を適応させながら、これらのグループの様々な要求や期待に対応できなければならない。これまでの研究では、特定のユーザー層に焦点を当てたものが多かったが、我々は、様々なユーザーグループに合わせてインタラクションを調整し、個々のユーザーが些細な中断と大きな中断の両方を通じてインタラクションを調整することを可能にする、適応的な人間とロボットのインタラクション(HRI)のための新しいフレームワークを提示する。我々の主な貢献は、オープンソースのコードベースを持つ適応的なROSベースのHRIフレームワークの開発である。このフレームワークは、高度な音声認識と音声アクティビティ検出により自然な対話をサポートし、対話ブリッジとして大規模言語モデル(LLM)を活用する。我々は、モジュールテストとシステムトライアルを通じて、我々のフレームワークの効率性を検証し、年齢認識における高い精度と、繰り返されるユーザー入力とプラン変更に対する頑健性を実証する。
要約(オリジナル)
To facilitate natural and intuitive interactions with diverse user groups in real-world settings, social robots must be capable of addressing the varying requirements and expectations of these groups while adapting their behavior based on user feedback. While previous research often focuses on specific demographics, we present a novel framework for adaptive Human-Robot Interaction (HRI) that tailors interactions to different user groups and enables individual users to modulate interactions through both minor and major interruptions. Our primary contributions include the development of an adaptive, ROS-based HRI framework with an open-source code base. This framework supports natural interactions through advanced speech recognition and voice activity detection, and leverages a large language model (LLM) as a dialogue bridge. We validate the efficiency of our framework through module tests and system trials, demonstrating its high accuracy in age recognition and its robustness to repeated user inputs and plan changes.
arxiv情報
| 著者 | Theresa Pekarek Rosin,Vanessa Hassouna,Xiaowen Sun,Luca Krohm,Henri-Leon Kordt,Michael Beetz,Stefan Wermter |
| 発行日 | 2025-04-03 08:22:27+00:00 |
| arxivサイト | arxiv_id(pdf) |