Trusting the Explainers: Teacher Validation of Explainable Artificial Intelligence for Course Design

要約

分析を学習するためのディープ ラーニング モデルは、ここ数年でますます人気が高まっています。
ただし、これらのアプローチは、おそらく信頼と透明性の欠如が原因で、現実の環境ではまだ広く採用されていません.
このホワイト ペーパーでは、ブラック ボックス ニューラル ネットワークに説明可能な AI 手法を実装することで、この問題に取り組みます。
この作業は、オンライン学習と混合学習のコンテキストと、学生の成功予測モデルの使用事例に焦点を当てています。
ペアワイズ研究デザインを使用して、コースのペア間の制御された違いを調査できるようにします。
私たちの分析は、教育的に関連する 1 つの側面と 2 つの一般的なインスタンス ベースの説明可能な AI メソッド (LIME と SHAP) が異なる 5 つのコース ペアをカバーしています。
コースやメソッド間で説明間の距離を定量的に比較します。
次に、LIME と SHAP の説明を、学生の成功に最も貢献すると信じている機能、最も信頼できる説明、およびこれらの洞察を実行可能なコース設計の決定にどのように変換できるかについて、大学レベルの教育者の 26 の半構造化インタビューで検証します。
私たちの結果は、定量的には、説明者は何が重要かについて互いに大きく意見が分かれており、質的には、専門家自身はどの説明が最も信頼できるかについて意見が一致していないことを示しています。
すべてのコード、拡張結果、およびインタビュー プロトコルは、https://github.com/epfl-ml4ed/trusting-explainers で提供されています。

要約(オリジナル)

Deep learning models for learning analytics have become increasingly popular over the last few years; however, these approaches are still not widely adopted in real-world settings, likely due to a lack of trust and transparency. In this paper, we tackle this issue by implementing explainable AI methods for black-box neural networks. This work focuses on the context of online and blended learning and the use case of student success prediction models. We use a pairwise study design, enabling us to investigate controlled differences between pairs of courses. Our analyses cover five course pairs that differ in one educationally relevant aspect and two popular instance-based explainable AI methods (LIME and SHAP). We quantitatively compare the distances between the explanations across courses and methods. We then validate the explanations of LIME and SHAP with 26 semi-structured interviews of university-level educators regarding which features they believe contribute most to student success, which explanations they trust most, and how they could transform these insights into actionable course design decisions. Our results show that quantitatively, explainers significantly disagree with each other about what is important, and qualitatively, experts themselves do not agree on which explanations are most trustworthy. All code, extended results, and the interview protocol are provided at https://github.com/epfl-ml4ed/trusting-explainers.

arxiv情報

著者 Vinitra Swamy,Sijia Du,Mirko Marras,Tanja Käser
発行日 2023-02-27 14:59:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CY, cs.HC, cs.LG パーマリンク