Why patient data cannot be easily forgotten?

要約

データ保護規則の範囲内で規定された権利により、患者は自分の情報に関する知識をデータ所有者が排除するように要求できます。
データで学習したAIの出現により、そのような権利はAIモデル内の患者のデータの知識を忘れるという要求にまで及ぶ可能性があることを想像できます。
ただし、AIモデルから患者の画像データを忘れることは、まだ十分に検討されていない問題です。
この論文では、モデルのパフォーマンスに対する患者データの影響を研究し、患者のデータに対して2つの仮説を立てます。それらは一般的で他の患者と類似しているか、エッジケース、つまりユニークでまれなケースを形成します。
患者データを簡単に忘れることはできないことを示します。
患者ごとの忘却を実行するためのターゲットを絞った忘却アプローチを提案します。
ベンチマークの自動心臓診断チャレンジデータセットに関する広範な実験は、最先端の方法とは対照的に、提案されたターゲット忘却アプローチのパフォーマンスの向上を示しています。

要約(オリジナル)

Rights provisioned within data protection regulations, permit patients to request that knowledge about their information be eliminated by data holders. With the advent of AI learned on data, one can imagine that such rights can extent to requests for forgetting knowledge of patient’s data within AI models. However, forgetting patients’ imaging data from AI models, is still an under-explored problem. In this paper, we study the influence of patient data on model performance and formulate two hypotheses for a patient’s data: either they are common and similar to other patients or form edge cases, i.e. unique and rare cases. We show that it is not possible to easily forget patient data. We propose a targeted forgetting approach to perform patient-wise forgetting. Extensive experiments on the benchmark Automated Cardiac Diagnosis Challenge dataset showcase the improved performance of the proposed targeted forgetting approach as opposed to a state-of-the-art method.

arxiv情報

著者 Ruolin Su,Xiao Liu,Sotirios A. Tsaftaris
発行日 2022-06-29 11:36:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク