要約
本研究は、視覚言語モデル(VLM)を用いて、子どもの精神的ウェルビーイングを評価する新しいロボット主導のアプローチを提示する。児童認知テスト(CAT)にヒントを得て、社会的ロボットNAOが子どもたちに絵の刺激を提示し、その画像について子どもたちの言語による語りを引き出し、それをCATの評価ガイドラインに従ってVLMが評価した。VLMの評価は、訓練を受けた心理学者による評価と系統的に比較された。その結果、VLMはウェルビーイングの懸念がない症例の識別においては中程度の信頼性を示すものの、臨床的懸念のある評価を正確に分類する能力は依然として限定的であることが明らかになった。さらに、モデルの性能は、年齢や性別などの人口統計学的要因を変化させても概ね一貫していたが、女児では有意に高い偽陽性率が観察され、性別属性に敏感である可能性が示された。これらの知見は、VLMをロボット主導の子どものウェルビーイング評価に統合することの可能性と課題を浮き彫りにしている。
要約(オリジナル)
This study presents a novel robot-led approach to assessing children’s mental wellbeing using a Vision Language Model (VLM). Inspired by the Child Apperception Test (CAT), the social robot NAO presented children with pictorial stimuli to elicit their verbal narratives of the images, which were then evaluated by a VLM in accordance with CAT assessment guidelines. The VLM’s assessments were systematically compared to those provided by a trained psychologist. The results reveal that while the VLM demonstrates moderate reliability in identifying cases with no wellbeing concerns, its ability to accurately classify assessments with clinical concern remains limited. Moreover, although the model’s performance was generally consistent when prompted with varying demographic factors such as age and gender, a significantly higher false positive rate was observed for girls, indicating potential sensitivity to gender attribute. These findings highlight both the promise and the challenges of integrating VLMs into robot-led assessments of children’s wellbeing.
arxiv情報
| 著者 | Nida Itrat Abbasi,Fethiye Irmak Dogan,Guy Laban,Joanna Anderson,Tamsin Ford,Peter B. Jones,Hatice Gunes |
| 発行日 | 2025-04-03 17:02:09+00:00 |
| arxivサイト | arxiv_id(pdf) |