要約
ドメイン全体での意思決定をサポートする際の人工知能(AI)の約束が高まっているにもかかわらず、AIへの適切な人間の依存を促進することは依然として重要な課題です。
このホワイトペーパーでは、AIへのタスク委任の距離ベースの不確実性スコアを調査する有用性を調査し、これらのスコアを人間の意思決定のための埋め込み表現を通じて視覚化する方法を説明します。
物理的な脳卒中リハビリテーション評価のためのAIベースのシステムを開発した後、私たちは19人の医療専門家と10人の学生を対象とした研究を実施し、AIへのユーザーの依存に対する距離ベースの不確実性スコアを調査する効果を理解しました。
私たちの調査結果は、距離ベースの不確実性スコアが、不確実なケースを特定する際に従来の確率に基づく不確実性スコアよりも優れていることを示しました。
さらに、タスク委任の信頼性スコアを調査し、距離ベースの不確実性スコアの埋め込みベースの視覚化をレビューした後、参加者は正しい決定の8.20%高い割合、決定の7.15%が正しいスコアを確認した後のAI出力を確認した後の7.14%低い割合を達成しました($ 0.01 $)。
私たちの調査結果は、距離ベースの不確実性スコアの可能性を強調しており、意思決定の正確性を高め、AIへの適切な依存を強化しながら、人間と共同の意思決定に対する継続的な課題について議論しています。
要約(オリジナル)
Despite the growing promise of artificial intelligence (AI) in supporting decision-making across domains, fostering appropriate human reliance on AI remains a critical challenge. In this paper, we investigate the utility of exploring distance-based uncertainty scores for task delegation to AI and describe how these scores can be visualized through embedding representations for human-AI decision-making. After developing an AI-based system for physical stroke rehabilitation assessment, we conducted a study with 19 health professionals and 10 students in medicine/health to understand the effect of exploring distance-based uncertainty scores on users’ reliance on AI. Our findings showed that distance-based uncertainty scores outperformed traditional probability-based uncertainty scores in identifying uncertain cases. In addition, after exploring confidence scores for task delegation and reviewing embedding-based visualizations of distance-based uncertainty scores, participants achieved an 8.20% higher rate of correct decisions, a 7.15% higher rate of changing their decisions to correct ones, and a 7.14% lower rate of incorrect changes after reviewing AI outputs than those reviewing probability-based uncertainty scores ($p<0.01$). Our findings highlight the potential of distance-based uncertainty scores to enhance decision accuracy and appropriate reliance on AI while discussing ongoing challenges for human-AI collaborative decision-making.
arxiv情報
著者 | Min Hun Lee,Martyn Zhe Yu Tok |
発行日 | 2025-05-23 16:12:39+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google