要約
大規模言語モデル (LLM)、そしてその結果としてのビジョン言語モデル (VLM) の出現は、ロボット工学研究者の間に新たな想像力を呼び起こしました。
現時点では、LLM と VLM をヒューマン ロボット インタラクション (HRI)、特に社会支援ロボット (SAR) に適用できるアプリケーションの範囲は未知の領域です。
ただし、LLM と VLM は、SAR 統合にとって前例のない機会と課題をもたらします。
私たちは、ロボット工学者が LLM と VLM を SAR に導入する際の機会と課題を明らかにすることを目指しています。
まず、1) HRI 研究における主要なロボット、2) SAR の重要な応用を調査する 250 以上の論文のメタスタディを実施しました。教育、ヘルスケア、エンターテイメントに重点を置きながら、3) 社会規範と信頼、偏見、偏見などの問題に取り組みました。
ロボット開発者が取り組まなければならない倫理。
次に、4) LLM または VLM で置き換えることができるロボットの重要なコンポーネントを特定し、5) LLM をロボット設計に統合する利点と 6) それに伴うリスクに対処しました。
最後に、LLM または VLM を SAR に責任を持って効果的に導入するための道筋を概説し、この導入に関して注意を払うことでこの議論を終わります。
要約(オリジナル)
The emergence of large language models (LLM) and, consequently, vision language models (VLM) has ignited new imaginations among robotics researchers. At this point, the range of applications to which LLM and VLM can be applied in human-robot interaction (HRI), particularly socially assistive robots (SARs), is unchartered territory. However, LLM and VLM present unprecedented opportunities and challenges for SAR integration. We aim to illuminate the opportunities and challenges when roboticists deploy LLM and VLM in SARs. First, we conducted a meta-study of more than 250 papers exploring 1) major robots in HRI research and 2) significant applications of SARs, emphasizing education, healthcare, and entertainment while addressing 3) societal norms and issues like trust, bias, and ethics that the robot developers must address. Then, we identified 4) critical components of a robot that LLM or VLM can replace while addressing the 5) benefits of integrating LLM into robot designs and the 6) risks involved. Finally, we outline a pathway for the responsible and effective adoption of LLM or VLM into SARs, and we close our discussion by offering caution regarding this deployment.
arxiv情報
著者 | Jesse Atuhurra |
発行日 | 2024-11-27 12:30:23+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google