要約
敵対的な攻撃から保護することは、マルチエージェントの一般的な問題です。
現実世界の攻撃者は主に人間の攻撃者であり、人間と対峙する際のパフォーマンスを向上させるために、防御方法には対戦相手のモデルが組み込まれていることがよくあります。
これまでの結果は、人間の行動をモデル化するとアルゴリズムのパフォーマンスが大幅に向上する可能性があることを示しています。
ただし、人間を正しくモデル化することは複雑な問題であり、モデルは多くの場合単純化され、サンプリング元の母集団全体に対する何らかの分布またはトレーニング パラメーターに従って人間が間違いを犯すと想定されます。
この研究では、悪意のある行為を行う可能性を高める性格タイプを特定した心理学者によって収集されたデータを使用します。
しかし、前作では手作りゲームのテストでは機種間の戦略的な違いがわかりませんでした。
私たちは、パラメータを心理的特性に結び付ける新しいモデルを作成しました。
私たちはパラメータ化されたゲームを最適化し、大きな違いがあるゲームを作成しました。
私たちの研究は、一部のモデルが異なる動作をするゲームが必要な場合や、モデルが一致しない状況を特定する場合に、自動ゲーム生成に役立ちます。
要約(オリジナル)
Protecting against adversarial attacks is a common multiagent problem. Attackers in the real world are predominantly human actors, and the protection methods often incorporate opponent models to improve the performance when facing humans. Previous results show that modeling human behavior can significantly improve the performance of the algorithms. However, modeling humans correctly is a complex problem, and the models are often simplified and assume humans make mistakes according to some distribution or train parameters for the whole population from which they sample. In this work, we use data gathered by psychologists who identified personality types that increase the likelihood of performing malicious acts. However, in the previous work, the tests on a handmade game could not show strategic differences between the models. We created a novel model that links its parameters to psychological traits. We optimized over parametrized games and created games in which the differences are profound. Our work can help with automatic game generation when we need a game in which some models will behave differently and to identify situations in which the models do not align.
arxiv情報
著者 | David Milec,Viliam Lisý,Christopher Kiekintveld |
発行日 | 2023-11-28 13:45:03+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google