Self-Supervised Prediction of the Intention to Interact with a Service Robot

要約

サービス ロボットは、サービス ロボットの動作を適応させるために、近くのユーザーが対話する意図があるかどうかを積極的に検出する機能があれば、よりスムーズな対話エクスペリエンスを提供できます。
サービスを提供できることを明示的に示すことによって。
この研究では、人間のユーザーがロボットと対話する確率を、対話が実際に始まる前に予測する学習ベースのアプローチを提案します。
このアプローチは自己監視型であり、人間と遭遇するたびに、対話が生じたかどうかに応じてロボットが自動的にラベルを付けることができるからです。
ユーザーのポーズと動きを考慮したさまざまな特徴セットを使用して、さまざまな分類アプローチを検討します。
3 つのシナリオでアプローチを検証し、展開します。
1 つ目は、オフィスの休憩エリアにいる従業員を表す $3442$ の自然なシーケンス (対話型と非対話型の両方) を収集します。これは、サービス ロボットの代わりにコーヒー マシンを考慮した、現実世界の挑戦的な設定です。
他の 2 つのシナリオは、サービス ロボットと対話する研究者を表しています (それぞれ $200$ と $72$ のシーケンス)。
結果は、困難な現実世界の設定であっても、私たちのアプローチは外部の監視なしで学習でき、支払い前に 3 ドルを超える前払いと対話するユーザーの意図を正確に分類 (つまり、0.9 ドルを超える AUROC) を達成できることを示しています。
実際に相互作用が起こります。

要約(オリジナル)

A service robot can provide a smoother interaction experience if it has the ability to proactively detect whether a nearby user intends to interact, in order to adapt its behavior e.g. by explicitly showing that it is available to provide a service. In this work, we propose a learning-based approach to predict the probability that a human user will interact with a robot before the interaction actually begins; the approach is self-supervised because after each encounter with a human, the robot can automatically label it depending on whether it resulted in an interaction or not. We explore different classification approaches, using different sets of features considering the pose and the motion of the user. We validate and deploy the approach in three scenarios. The first collects $3442$ natural sequences (both interacting and non-interacting) representing employees in an office break area: a real-world, challenging setting, where we consider a coffee machine in place of a service robot. The other two scenarios represent researchers interacting with service robots ($200$ and $72$ sequences, respectively). Results show that, even in challenging real-world settings, our approach can learn without external supervision, and can achieve accurate classification (i.e. AUROC greater than $0.9$) of the user’s intention to interact with an advance of more than $3$s before the interaction actually occurs.

arxiv情報

著者 Gabriele Abbate,Alessandro Giusti,Viktor Schmuck,Oya Celiktutan,Antonio Paolillo
発行日 2023-09-14 07:34:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク