A Theory of Bounded Inductive Rationality

要約

合理的選択に関する支配的な理論は、論理的な全知を前提としています。
つまり、意思決定の問題に直面したとき、エージェントは関連するすべての計算を実行し、関連するすべての論理的/数学的主張の真理値を決定できると想定しています。
この仮定は、たとえば、円周率の離れた桁に賭けを提案する場合、またはエージェントが計算的に解決できない計画の問題に直面する場合には非現実的です。
さらに、論理的全知の仮定は、環境にエージェント自体の記述が含まれる可能性がある場合に矛盾を引き起こします。
重要なことは、ゲーム理論で研究される戦略的相互作用は、合理的なエージェントがその環境 (他のプレイヤー) によって予測される意思決定問題であるということです。
この論文では、論理的な全知を前提としない合理的な意思決定の理論を展開します。
私たちは、意思決定の問題 (円周率の桁への賭けや他のエージェントとのゲームなどを含む) に繰り返し直面するエージェントを考慮します。
この論文の主な貢献は、そのようなエージェントに対する合理性の賢明な理論を提供することです。
大まかに言えば、有界合理的帰納エージェントが効率的に計算可能な各仮説を無限に頻繁にテストし、高い報酬の約束を守る仮説に従うことが必要です。
次に、この意味で合理的なエージェントには他の望ましい特性があることを証明します。
たとえば、彼らは、期待される報酬でランダムおよび疑似ランダムの宝くじを評価することを学びます。
最後に、異なるエージェント間の戦略的相互作用を考察し、有界合理的帰納エージェントがどのような戦略に収束できるかについての民間定理を証明します。

要約(オリジナル)

The dominant theories of rational choice assume logical omniscience. That is, they assume that when facing a decision problem, an agent can perform all relevant computations and determine the truth value of all relevant logical/mathematical claims. This assumption is unrealistic when, for example, we offer bets on remote digits of pi or when an agent faces a computationally intractable planning problem. Furthermore, the assumption of logical omniscience creates contradictions in cases where the environment can contain descriptions of the agent itself. Importantly, strategic interactions as studied in game theory are decision problems in which a rational agent is predicted by its environment (the other players). In this paper, we develop a theory of rational decision making that does not assume logical omniscience. We consider agents who repeatedly face decision problems (including ones like betting on digits of pi or games against other agents). The main contribution of this paper is to provide a sensible theory of rationality for such agents. Roughly, we require that a boundedly rational inductive agent tests each efficiently computable hypothesis infinitely often and follows those hypotheses that keep their promises of high rewards. We then prove that agents that are rational in this sense have other desirable properties. For example, they learn to value random and pseudo-random lotteries at their expected reward. Finally, we consider strategic interactions between different agents and prove a folk theorem for what strategies bounded rational inductive agents can converge to.

arxiv情報

著者 Caspar Oesterheld,Abram Demski,Vincent Conitzer
発行日 2023-07-11 07:13:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.GT, cs.LG, I.2 パーマリンク