Human-mediated Large Language Models for Robotic Intervention in Children with Autism Spectrum Disorders

要約

自閉症スペクトラム障害 (ASD) を持つ個人に対するロボット介入では、通常、事前に定義されたスクリプトを使用して、1 対 1 の治療セッション中に言語コンテンツを配信します。
この慣行では、ロボットの使用が限定された事前仲介型の教育カリキュラムに限定されます。
この論文では、ASD を持つ子供たちへのロボット介入の 1 つにおいて、視点をとった指導を実装することでロボットの自律性を高めます。
私たちのアプローチでは、大規模言語モデル (LLM) を使用して言語コンテンツをテキストとして生成し、それをロボット音声を通じて子供に配信します。
提案されたパイプラインでは、ロボットが開始者、プロンプター、強化者の 3 つの役割を果たす視点取得を教えます。
GPT-2 + BART パイプラインを採用して、社交的な状況を生成し、(イニシエーターとして)質問し、必要に応じて(プロンプターとして)オプションを提供します。
ロボットは、正解に対して積極的な強化を(強化子として)与えることで子供を励まします。
私たちの技術的貢献に加えて、研究者が子供の参加者として、実際のパースペクティブ教育セッションをシミュレートする分野の専門家との 10 分間のセッションを実施しました。
これらのセッションでは、NASA TLX や GodSpeed からの調査を含む調査を通じて、当社のロボット介入パイプラインを検証しました。
BERTScore を使用して GPT-2 + BART パイプラインとすべて GPT-2 を比較したところ、前者のパフォーマンスが優れていることがわかりました。
ドメイン専門家による回答に基づくと、ロボット セッションは、ロボットなしのセッションと比較して、精神的または肉体的要求、時間的要求、労力、フラストレーションの追加増加がなく、より高いパフォーマンスを示しました。
また、この分野の専門家はロボットが理想的に安全で、好感が持て、信頼できるものであると認識していると結論付けました。

要約(オリジナル)

The robotic intervention for individuals with Autism Spectrum Disorder (ASD) has generally used pre-defined scripts to deliver verbal content during one-to-one therapy sessions. This practice restricts the use of robots to limited, pre-mediated instructional curricula. In this paper, we increase robot autonomy in one such robotic intervention for children with ASD by implementing perspective-taking teaching. Our approach uses large language models (LLM) to generate verbal content as texts and then deliver it to the child via robotic speech. In the proposed pipeline, we teach perspective-taking through which our robot takes up three roles: initiator, prompter, and reinforcer. We adopted the GPT-2 + BART pipelines to generate social situations, ask questions (as initiator), and give options (as prompter) when required. The robot encourages the child by giving positive reinforcement for correct answers (as a reinforcer). In addition to our technical contribution, we conducted ten-minute sessions with domain experts simulating an actual perspective teaching session, with the researcher acting as a child participant. These sessions validated our robotic intervention pipeline through surveys, including those from NASA TLX and GodSpeed. We used BERTScore to compare our GPT-2 + BART pipeline with an all GPT-2 and found the performance of the former to be better. Based on the responses by the domain experts, the robot session demonstrated higher performance with no additional increase in mental or physical demand, temporal demand, effort, or frustration compared to a no-robot session. We also concluded that the domain experts perceived the robot as ideally safe, likable, and reliable.

arxiv情報

著者 Ruchik Mishra,Karla Conn Welch,Dan O Popa
発行日 2024-07-10 01:27:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク