Adversarial Robustness for Tabular Data through Cost and Utility Awareness

要約

不正行為や悪用の検出など、機械学習の安全性が重要なアプリケーションの多くは、表形式のドメインのデータを使用します。
敵対的な例は、これらのアプリケーションにとって特に損害を与える可能性があります。
それでも、敵対的ロバスト性に関する既存の研究は、主に画像およびテキスト ドメインの機械学習モデルに焦点を当てています。
表形式のデータと画像またはテキストの違いにより、既存の脅威モデルは表形式のドメインには適していないと主張します。
これらのモデルは、攻撃のコストが知覚できないことよりも重要である可能性があること、または敵対者がさまざまな敵対的な例を展開することから得られる効用にさまざまな価値を割り当てる可能性があることを捉えていません。
これらの違いにより、画像とテキストに使用される攻撃と防御の方法を表形式の設定に直接適用できないことを示します。
表形式のドメインを標的とする攻撃者の敵対的な機能と制約に合わせて調整された、コストとユーティリティを意識した新しい脅威モデルを提案することで、これらの問題に対処します。
攻撃と防御のメカニズムを設計できるフレームワークを導入し、コストとユーティリティを意識した敵対者 (たとえば、特定の財政予算によって制約されている敵対者) からモデルを保護します。
敵対的な例が経済的および社会的影響を与える可能性があるアプリケーションに対応する3つのデータセットで、私たちのアプローチが効果的であることを示します。

要約(オリジナル)

Many safety-critical applications of machine learning, such as fraud or abuse detection, use data in tabular domains. Adversarial examples can be particularly damaging for these applications. Yet, existing works on adversarial robustness primarily focus on machine-learning models in image and text domains. We argue that, due to the differences between tabular data and images or text, existing threat models are not suitable for tabular domains. These models do not capture that the costs of an attack could be more significant than imperceptibility, or that the adversary could assign different values to the utility obtained from deploying different adversarial examples. We demonstrate that, due to these differences, the attack and defense methods used for images and text cannot be directly applied to tabular settings. We address these issues by proposing new cost and utility-aware threat models that are tailored to the adversarial capabilities and constraints of attackers targeting tabular domains. We introduce a framework that enables us to design attack and defense mechanisms that result in models protected against cost and utility-aware adversaries, for example, adversaries constrained by a certain financial budget. We show that our approach is effective on three datasets corresponding to applications for which adversarial examples can have economic and social implications.

arxiv情報

著者 Klim Kireev,Bogdan Kulynych,Carmela Troncoso
発行日 2023-02-24 17:35:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CR, cs.LG パーマリンク