A Note on ‘Towards Efficient Data Valuation Based on the Shapley Value”


Shapley 値 (SV) は、データ評価の有望な方法として浮上しています。
ただし、SV の計算または推定は、多くの場合、計算コストが高くなります。
この課題を克服するために、Jia et al。
(2019) 好ましい漸近サンプルの複雑さを達成する「グループテストベースの SV estimator」と呼ばれる高度な SV 推定アルゴリズムを提案しています。
このテクニカル ノートでは、この SV 推定器の分析と設計の選択におけるいくつかの改善点を紹介します。
さらに、グループ テストに基づく SV 推定量は、収集したサンプルを完全には再利用しないことを指摘します。
私たちの分析と洞察は、データ評価のための効率的な SV 推定アルゴリズムを開発する際の課題をよりよく理解するのに役立ちます。


The Shapley value (SV) has emerged as a promising method for data valuation. However, computing or estimating the SV is often computationally expensive. To overcome this challenge, Jia et al. (2019) propose an advanced SV estimation algorithm called “Group Testing-based SV estimator” which achieves favorable asymptotic sample complexity. In this technical note, we present several improvements in the analysis and design choices of this SV estimator. Moreover, we point out that the Group Testing-based SV estimator does not fully reuse the collected samples. Our analysis and insights contribute to a better understanding of the challenges in developing efficient SV estimation algorithms for data valuation.


著者 Jiachen T. Wang,Ruoxi Jia
発行日 2023-02-22 15:13:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク