要約
不確実性や攻撃を受けやすいデータを使用した機能選択などの機械学習の問題に適用される敵対的なコンテキストでの類似の最適化を研究します。
攻撃者(またはインターディクター)と攻撃者がA $ K $ -Submodular関数を最大化するというディフェンダーの目的を最小限に抑えることを目指しているディフェンダーの間のスタッカーバーグゲームに焦点を当てています。
攻撃の成功と固有のデータノイズの成功から生じる不確実性を許可し、ランダムパラメーターの確率分布の知識が不完全なため、課題に対処します。
具体的には、分配的に堅牢な$ k $ k $ -Submodular intriction問題(DRO $ k $ -SIP)および分布的にリスク受容的な$ K $ -Submodular断続的な問題(DRR $ K $ -SIP)と、それらを解くための有益な収束正確なアルゴリズムを導入します。
DRO $ K $ -SIPを解決するとき、攻撃者は、あいまいさセット内の最悪の確率分布に関して予想されるペイオフを最適化し、それにより分布のあいまいさにもかかわらず堅牢な攻撃戦略があります。
対照的に、DRR $ K $ -SIPは、攻撃者戦略を最高のケース確率分布で識別し、ディフェンダーの重要な脆弱性を特定します。
DRO $ k $ -SIPとDRR $ K $ -SIPの両方から派生した最適な値は、ディフェンダーの目的関数の期待値に対して信頼区間のような範囲を提供し、分布のあいまいさをキャプチャします。
ウィスコンシンの乳がんデータと合成データを使用して、特徴の選択とセンサーの配置問題のインスタンスについて計算実験を実施します。
要約(オリジナル)
We study submodular optimization in adversarial context, applicable to machine learning problems such as feature selection using data susceptible to uncertainties and attacks. We focus on Stackelberg games between an attacker (or interdictor) and a defender where the attacker aims to minimize the defender’s objective of maximizing a $k$-submodular function. We allow uncertainties arising from the success of attacks and inherent data noise, and address challenges due to incomplete knowledge of the probability distribution of random parameters. Specifically, we introduce Distributionally Robust $k$-Submodular Interdiction Problem (DRO $k$-SIP) and Distributionally Risk-Receptive $k$-Submodular Interdiction Problem (DRR $k$-SIP) along with finitely convergent exact algorithms for solving them. When solving the DRO $k$-SIP, the attacker optimizes their expected payoff with respect to the worst-case probability distribution within the ambiguity set, and thereby have robust attack strategies despite distributional ambiguity. In contrast, the DRR $k$-SIP identifies attacker strategies with the best-case probability distribution, and identifies critical vulnerabilities for the defender. The optimal values derived from both DRO $k$-SIP and DRR $k$-SIP offer a confidence interval-like range for the expected value of the defender’s objective function, capturing distributional ambiguity. We conduct computational experiments on instances of feature selection and sensor placement problems, using Wisconsin breast cancer data and synthetic data, respectively.
arxiv情報
著者 | Seonghun Park,Manish Bansal |
発行日 | 2025-06-18 15:33:09+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google