Conversation Games and a Strategic View of the Turing Test

要約

多くのゲーム理論モデルは、しばしば自然言語に依存する実際の相互作用を複製しますが、言語が戦略的相互作用の中心であるゲームの明示的な研究は限られたままです。
このペーパーでは、言語戦略的相互作用に基づいたマルチステージの広範なフォームゲームである\ emph {Conversation Game}を紹介します。
Verdict Gamesと呼ばれるゲームのサブセットに焦点を当てています。
評決ゲームでは、2人のプレイヤーが会話に貢献することを交互に行います。会話は、決定的なバイナリ評決を行う可能性のある非戦略的裁判官または対話を継続する決定を下す可能性のある非戦略的裁判官によって評価されます。
制限に達するか、評決が与えられたらゲームは終了します。
尋問や裁判所のプロセスなど、多くのおなじみのプロセスがこのカテゴリに分類されています。
また、チューリングテストが評決ゲームのインスタンスであることを示し、高度なAI欺ceptionの時代におけるチューリングテストの戦略的見解の重要性について議論します。
シミュレーション実験によって提案された概念の実用的な関連性を示し、戦略的エージェントがナイーブエージェントを高いマージンで上回ることを示します。

要約(オリジナル)

Although many game-theoretic models replicate real interactions that often rely on natural language, explicit study of games where language is central to strategic interaction remains limited. This paper introduces the \emph{conversation game}, a multi-stage, extensive-form game based on linguistic strategic interaction. We focus on a subset of the games, called verdict games. In a verdict game, two players alternate to contribute to a conversation, which is evaluated at each stage by a non-strategic judge who may render a conclusive binary verdict, or a decision to continue the dialogue. The game ends once a limit is reached or a verdict is given. We show many familiar processes, such as interrogation or a court process fall under this category. We also, show that the Turing test is an instance of verdict game, and discuss the significance of a strategic view of the Turing test in the age of advanced AI deception. We show the practical relevance of the proposed concepts by simulation experiments, and show that a strategic agent outperforms a naive agent by a high margin.

arxiv情報

著者 Kaveh Aryan
発行日 2025-01-30 16:08:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.GT パーマリンク