要約
ChatGPT と GPT-4 の導入以来、これらのモデルは多数のタスクにわたってテストされてきました。
彼らがあらゆる分野で熟練していることは明らかですが、ゲームをプレイする際の適性、特にポーカーの分野での適性はまだ解明されていません。
ポーカーは、不確実性と不完全な情報の下での意思決定を必要とするゲームです。
この論文では、ChatGPT と GPT-4 にポーカー テストを実施し、彼らのポーカー スキルを評価します。
私たちの調査結果では、両方のモデルがスターティング ハンドの評価、プレイング ポジション、ゲーム理論最適化 (GTO) ポーカーのその他の複雑さなどの概念を包含し、ポーカーについて高度な理解を示している一方で、ChatGPT と GPT-4 はどちらもゲーム理論最適化ポーカー プレーヤーではないことが明らかになりました。
。
ポーカーにおける収益性の高い戦略は、大規模なサンプルに対する期待値に基づいて評価されます。
一連の実験を通じて、私たちはまず、これらのモデルでポーカーをプレイするための最適なプロンプトとモデル パラメーターの特性を発見します。
私たちの観察により、2 つのモデルの異なる演奏上のペルソナが明らかになります。
まず、GPT-4 は ChatGPT よりも高度なポーカー プレーヤーであると結論付けます。
この調査により、2 つのモデルの異なるポーカー戦術、つまり、ChatGPT の保守性と GPT-4 の攻撃性の対比が明らかになります。
ポーカーの専門用語では、GTO ポーカーをプレイするよう命じられたとき、ChatGPT はつまらないようにプレイします。つまり、プレミアム ハンドのみに関与し、ハンドの大部分をフォールドする傾向があります。
同じ指示を受けると、GPT-4 は狂ったようにプレイし、ルーズで攻撃的なプレイ スタイルを示します。
どちらの戦略も、比較的高度ではありますが、ゲーム理論にとって最適なものではありません。
要約(オリジナル)
Since the introduction of ChatGPT and GPT-4, these models have been tested across a large number of tasks. Their adeptness across domains is evident, but their aptitude in playing games, and specifically their aptitude in the realm of poker has remained unexplored. Poker is a game that requires decision making under uncertainty and incomplete information. In this paper, we put ChatGPT and GPT-4 through the poker test and evaluate their poker skills. Our findings reveal that while both models display an advanced understanding of poker, encompassing concepts like the valuation of starting hands, playing positions and other intricacies of game theory optimal (GTO) poker, both ChatGPT and GPT-4 are NOT game theory optimal poker players. Profitable strategies in poker are evaluated in expectations over large samples. Through a series of experiments, we first discover the characteristics of optimal prompts and model parameters for playing poker with these models. Our observations then unveil the distinct playing personas of the two models. We first conclude that GPT-4 is a more advanced poker player than ChatGPT. This exploration then sheds light on the divergent poker tactics of the two models: ChatGPT’s conservativeness juxtaposed against GPT-4’s aggression. In poker vernacular, when tasked to play GTO poker, ChatGPT plays like a nit, which means that it has a propensity to only engage with premium hands and folds a majority of hands. When subjected to the same directive, GPT-4 plays like a maniac, showcasing a loose and aggressive style of play. Both strategies, although relatively advanced, are not game theory optimal.
arxiv情報
著者 | Akshat Gupta |
発行日 | 2023-12-21 15:14:46+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google