Statistical inference using machine learning and classical techniques based on accumulated local effects (ALE)

要約

Accumulated Local Effects (ALE) は、ブラックボックス機械学習 (ML) アルゴリズムの結果をグローバルに説明するためのモデルに依存しないアプローチです。
ALE に基づいた統計的推論の実行には、少なくとも 3 つの課題があります。1 つは、特に小規模なデータセットのコンテキストにおいて、ALE 分析の信頼性を確保することです。
ML における変数の全体的な影響を直感的に特徴付ける。
ML データ分析から堅牢な推論を行うこともできます。
これに応えて、ALE を使用した統計的推論のための革新的なツールと手法を導入し、データセットのサイズに合わせたブートストラップ型信頼区間を確立し、結果変数のスケールと正規化されたスケールの両方に対する影響を直感的に示す ALE 効果サイズの尺度を導入します。
さらに、R の「ale」パッケージで利用可能な実装を使用して、ALE が適切に強調する柔軟なパターンを反映して、信頼できる統計的推論を引き出すためにこれらのツールを使用する方法を示します。この研究は、ALE と、ML および統計分析における ALE の適用性に関する議論を推進します。
前進し、現場の一般的な課題に対する実用的なソリューションを提供します。

要約(オリジナル)

Accumulated Local Effects (ALE) is a model-agnostic approach for global explanations of the results of black-box machine learning (ML) algorithms. There are at least three challenges with conducting statistical inference based on ALE: ensuring the reliability of ALE analyses, especially in the context of small datasets; intuitively characterizing a variable’s overall effect in ML; and making robust inferences from ML data analysis. In response, we introduce innovative tools and techniques for statistical inference using ALE, establishing bootstrapped confidence intervals tailored to dataset size and introducing ALE effect size measures that intuitively indicate effects on both the outcome variable scale and a normalized scale. Furthermore, we demonstrate how to use these tools to draw reliable statistical inferences, reflecting the flexible patterns ALE adeptly highlights, with implementations available in the ‘ale’ package in R. This work propels the discourse on ALE and its applicability in ML and statistical analysis forward, offering practical solutions to prevailing challenges in the field.

arxiv情報

著者 Chitu Okoli
発行日 2024-02-12 17:00:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク