Manipulating Predictions over Discrete Inputs in Machine Teaching

要約

機械教育では多くの場合、モデル (「生徒」と呼ばれる) が教師によって与えられた特定の目標を達成するのに役立つ最適な (通常は最小限の) データセットの作成が含まれます。
連続領域では多くの研究が行われていますが、離散領域での機械学習の有効性に関する研究は比較的限られています。
この論文は、離散領域での機械学習、特にトレーニング データを効率的に変更することで教師の目標に基づいて生徒モデルの予測を操作することに焦点を当てています。
このタスクを組み合わせ最適化問題として定式化し、反復探索アルゴリズムを提案することで解決します。
私たちのアルゴリズムは、教師が生徒のモデルを改善するために誤った予測を修正しようとしたり、モデルを悪意を持って操作して一部の特定のサンプルを個人的な利益に合わせたターゲット クラスに誤分類しようとしたりするシナリオで、数値的に大きなメリットを示します。
実験結果は、私たちが提案したアルゴリズムが、モデルの予測を効果的かつ効率的に操作する際に、従来のベースラインを上回る優れたパフォーマンスを発揮できることを示しています。

要約(オリジナル)

Machine teaching often involves the creation of an optimal (typically minimal) dataset to help a model (referred to as the `student’) achieve specific goals given by a teacher. While abundant in the continuous domain, the studies on the effectiveness of machine teaching in the discrete domain are relatively limited. This paper focuses on machine teaching in the discrete domain, specifically on manipulating student models’ predictions based on the goals of teachers via changing the training data efficiently. We formulate this task as a combinatorial optimization problem and solve it by proposing an iterative searching algorithm. Our algorithm demonstrates significant numerical merit in the scenarios where a teacher attempts at correcting erroneous predictions to improve the student’s models, or maliciously manipulating the model to misclassify some specific samples to the target class aligned with his personal profits. Experimental results show that our proposed algorithm can have superior performance in effectively and efficiently manipulating the predictions of the model, surpassing conventional baselines.

arxiv情報

著者 Xiaodong Wu,Yufei Han,Hayssam Dahrouj,Jianbing Ni,Zhenwen Liang,Xiangliang Zhang
発行日 2024-01-31 14:23:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, I.2.6 パーマリンク