要約
現実世界の設定で多様なユーザー グループとの自然かつ直観的な対話を促進するには、ソーシャル ロボットがユーザーのフィードバックに基づいて動作を適応させながら、これらのグループのさまざまな要件や期待に対処できなければなりません。
これまでの研究は特定の人口統計に焦点を当てていることが多いですが、私たちは、さまざまなユーザー グループに合わせてインタラクションを調整し、個々のユーザーが軽微な中断と重大な中断の両方を通じてインタラクションを調整できるようにする、適応型ヒューマン ロボット インタラクション (HRI) のための新しいフレームワークを提案します。
私たちの主な貢献には、オープンソース コード ベースを使用した適応型の ROS ベースの HRI フレームワークの開発が含まれます。
このフレームワークは、高度な音声認識と音声アクティビティ検出を通じて自然な対話をサポートし、対話ブリッジとして大規模言語モデル (LLM) を活用します。
私たちはモジュールテストとシステムトライアルを通じてフレームワークの効率を検証し、年齢認識の高い精度と、繰り返されるユーザー入力や計画変更に対する堅牢性を実証します。
要約(オリジナル)
To facilitate natural and intuitive interactions with diverse user groups in real-world settings, social robots must be capable of addressing the varying requirements and expectations of these groups while adapting their behavior based on user feedback. While previous research often focuses on specific demographics, we present a novel framework for adaptive Human-Robot Interaction (HRI) that tailors interactions to different user groups and enables individual users to modulate interactions through both minor and major interruptions. Our primary contributions include the development of an adaptive, ROS-based HRI framework with an open-source code base. This framework supports natural interactions through advanced speech recognition and voice activity detection, and leverages a large language model (LLM) as a dialogue bridge. We validate the efficiency of our framework through module tests and system trials, demonstrating its high accuracy in age recognition and its robustness to repeated user inputs and plan changes.
arxiv情報
著者 | Theresa Pekarek Rosin,Vanessa Hassouna,Xiaowen Sun,Luca Krohm,Henri-Leon Kordt,Michael Beetz,Stefan Wermter |
発行日 | 2024-10-15 08:16:43+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google