Dueling Over Dessert, Mastering the Art of Repeated Cake Cutting

要約

私たちは、アリスとボブという 2 人のプレイヤーの間でケーキを食べながら個人的な評価を行い、公平な分割を繰り返すという設定を検討します。
各ラウンドでは、前のラウンドのものと同じ新しいケーキが到着します。
アリスは自分の選択した位置でケーキをカットしますが、ボブは左の部分か右の部分を選択し、残りをアリスに残します。
ボブが左/右を選択する前にアリスのカットポイントを観察する逐次バージョンと、選択を行った後にのみアリスのカットポイントを観察する同時バージョンの 2 つのバージョンを検討します。
同時バージョンは、Aumann と Maschler (1995) によって最初に検討されました。
ボブがほぼ近視で、お気に入りの作品を頻繁に選びすぎる場合、二分探索に似た戦略を通じてアリスによって体系的に彼が利用される可能性があることが観察されています。
この戦略により、アリスは精度を高めながらボブの好みを近似できるようになり、それによって時間の経過とともに不釣り合いなリソースのシェアを確保できるようになります。
私たちは、プレーヤーが他のプレーヤーをどれだけ利用できるかの限界を分析し、公平なユーティリティプロファイルが実際に達成可能であることを示します。
具体的には、プレーヤーは、他のプレーヤーのユーティリティを平均約 $1/2$ に保ちながら、自分自身が得られることを保証することで、プレイのあらゆる軌道の制限内で $(1/2, 1/2)$ の公平なユーティリティ プロファイルを強制することができます。
平均で少なくとも約 1/2 ドル。
ブラックウェルの接近可能性との関連を使用して、この定理を示します。
最後に、プレイヤーが他のプレイヤーの経験的分布に最もよく反応する、架空のプレイとして知られる自然の力学を分析します。
架空の遊びは $O(1/\sqrt{T})$ の割合で $(1/2, 1/2)$ の公平な効用プロファイルに収束することを示します。

要約(オリジナル)

We consider the setting of repeated fair division between two players, denoted Alice and Bob, with private valuations over a cake. In each round, a new cake arrives, which is identical to the ones in previous rounds. Alice cuts the cake at a point of her choice, while Bob chooses the left piece or the right piece, leaving the remainder for Alice. We consider two versions: sequential, where Bob observes Alice’s cut point before choosing left/right, and simultaneous, where he only observes her cut point after making his choice. The simultaneous version was first considered by Aumann and Maschler (1995). We observe that if Bob is almost myopic and chooses his favorite piece too often, then he can be systematically exploited by Alice through a strategy akin to a binary search. This strategy allows Alice to approximate Bob’s preferences with increasing precision, thereby securing a disproportionate share of the resource over time. We analyze the limits of how much a player can exploit the other one and show that fair utility profiles are in fact achievable. Specifically, the players can enforce the equitable utility profile of $(1/2, 1/2)$ in the limit on every trajectory of play, by keeping the other player’s utility to approximately $1/2$ on average while guaranteeing they themselves get at least approximately $1/2$ on average. We show this theorem using a connection with Blackwell approachability. Finally, we analyze a natural dynamic known as fictitious play, where players best respond to the empirical distribution of the other player. We show that fictitious play converges to the equitable utility profile of $(1/2, 1/2)$ at a rate of $O(1/\sqrt{T})$.

arxiv情報

著者 Simina Brânzei,MohammadTaghi Hajiaghayi,Reed Phillips,Suho Shin,Kun Wang
発行日 2024-02-13 15:53:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.GT, econ.TH パーマリンク