要約
タイトル:「林の中の双子よりも手元にある鳥が価値ある理由」
要約:
– AIには「解釈可能性」と「精度」というトレードオフがあると言われているが、多くの問題ではこのトレードオフは成立しない。
– この論文は、フライトの出発遅延を予測する回帰問題の文脈で、勾配ブースティング決定木のXGBoostを用いた最も正確なデータ回帰モデルを構築したことを述べている。
– XGB-CBR Twinを構築し、CBRモデルにXGBoostの特徴重要度をグローバルウェイトに変換させることで、CBRモデルだけで最も精度の高いローカル予測を提供し、モデルのグローバルな説明を提供し、最も解釈可能な表現を提供した。
– この結果得られたCBRモデルは、この問題文脈の正確性と解釈可能性の基準となり、SHAPとLIMEという2つの加算特徴属性方法を評価するために使用される。
– ローカル精度と特徴付けに関する結果は、今後有益な研究の方向性を提示している。
要約(オリジナル)
AI methods referred to as interpretable are often discredited as inaccurate by supporters of the existence of a trade-off between interpretability and accuracy. In many problem contexts however this trade-off does not hold. This paper discusses a regression problem context to predict flight take-off delays where the most accurate data regression model was trained via the XGBoost implementation of gradient boosted decision trees. While building an XGB-CBR Twin and converting the XGBoost feature importance into global weights in the CBR model, the resultant CBR model alone provides the most accurate local prediction, maintains the global importance to provide a global explanation of the model, and offers the most interpretable representation for local explanations. This resultant CBR model becomes a benchmark of accuracy and interpretability for this problem context, and hence it is used to evaluate the two additive feature attribute methods SHAP and LIME to explain the XGBoost regression model. The results with respect to local accuracy and feature attribution lead to potentially valuable future work.
arxiv情報
著者 | Mobyen Uddin Ahmed,Shaibal Barua,Shahina Begum,Mir Riyanul Islam,Rosina O Weber |
発行日 | 2023-05-09 00:55:09+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI