要約
監視された機械学習と予測モデルは今日、印象的な基準を達成しており、数年前に考えられなかった質問に答えることができます。
これらの成功に加えて、最も監視されている機械学習アルゴリズムの主な強さである純粋な予測を超えて、不確実性の定量化も関連性があり、必要であることが明らかになります。
ただし、定量化が可能になる前に、不確実性の種類とソースを正確に定義する必要があります。
この方向の最初の概念とアイデアが近年出現していますが、このペーパーでは概念的で基本的な科学の観点を採用し、不確実性の可能性のある原因を調べます。
統計学者の視点を採用することにより、機械学習により一般的に関連付けられているアレアトリックおよび認識論的不確実性の概念について説明します。
この論文は、2種類の不確実性を形式化することを目的としており、不確実性の原因がその他であり、常にaleatoricと認識論に分解できるとは限らないことを示しています。
統計的概念と機械学習における不確実性の描画との類似点は、データの役割と不確実性への影響を強調します。
要約(オリジナル)
Supervised machine learning and predictive models have achieved an impressive standard today, enabling us to answer questions that were inconceivable a few years ago. Besides these successes, it becomes clear, that beyond pure prediction, which is the primary strength of most supervised machine learning algorithms, the quantification of uncertainty is relevant and necessary as well. However, before quantification is possible, types and sources of uncertainty need to be defined precisely. While first concepts and ideas in this direction have emerged in recent years, this paper adopts a conceptual, basic science perspective and examines possible sources of uncertainty. By adopting the viewpoint of a statistician, we discuss the concepts of aleatoric and epistemic uncertainty, which are more commonly associated with machine learning. The paper aims to formalize the two types of uncertainty and demonstrates that sources of uncertainty are miscellaneous and can not always be decomposed into aleatoric and epistemic. Drawing parallels between statistical concepts and uncertainty in machine learning, we emphasise the role of data and their influence on uncertainty.
arxiv情報
著者 | Cornelia Gruber,Patrick Oliver Schenk,Malte Schierholz,Frauke Kreuter,Göran Kauermann |
発行日 | 2025-01-28 10:02:15+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google