要約
Wasserstein距離は、データ分布を比較するための強力なフレームワークを提供します。
それらを使用して、時間の経過とともにプロセスを分析したり、データ内の不均一性を検出したりすることができます。
ただし、ワッサースタインの距離を計算したり、対応するトランスポートマップ(または結合)を分析するだけでは、高いまたは低いワッサースタイン距離に寄与する要因を理解するのに十分ではない場合があります。
この作業では、説明可能なAIに基づいた新しいソリューションを提案します。これにより、データサブグループ、入力機能、解釈可能なサブスペースなど、さまざまなデータコンポーネントに効率的かつ正確に属性があります。
私たちの方法は、多様なデータセットとWasserstein距離の仕様にわたって高い精度を達成し、その実用性は2つのユースケースで実証されています。
要約(オリジナル)
Wasserstein distances provide a powerful framework for comparing data distributions. They can be used to analyze processes over time or to detect inhomogeneities within data. However, simply calculating the Wasserstein distance or analyzing the corresponding transport map (or coupling) may not be sufficient for understanding what factors contribute to a high or low Wasserstein distance. In this work, we propose a novel solution based on Explainable AI that allows us to efficiently and accurately attribute Wasserstein distances to various data components, including data subgroups, input features, or interpretable subspaces. Our method achieves high accuracy across diverse datasets and Wasserstein distance specifications, and its practical utility is demonstrated in two use cases.
arxiv情報
著者 | Philip Naumann,Jacob Kauffmann,Grégoire Montavon |
発行日 | 2025-05-09 15:26:38+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google