Distinguishing Risk Preferences using Repeated Gambles

要約

繰り返されるギャンブルのシーケンスは、人間または人工意思決定エージェントのリスク選好を特徴付けるための実験ツールを提供します。
この推論の難易度は、提供されるギャンブルの詳細やゲームの反復回数などの要因によって異なります。
この論文では、有限シーケンスの繰り返しギャンブルを提示された人工エージェントの観察された選択からリスク選好を推測するという実際的な課題を詳細に検討します。
私たちの動機は、一連の加法的ギャンブル(利益と損失が現在の富に依存しない)を繰り返すことで長期的な富を最大化する戦略が、乗法的ギャンブルを繰り返す(利益と損失が現在の富に比例する)戦略とは異なるという事実にあります。
) エージェントが最適な戦略を採用しているかどうかを判断するには、リスク選好を正確に測定する必要があります。
エージェントが直面するギャンブルの種類を一般化するために、時系列分析のために特徴エンジニアリングから借用したツールである Yeo-Johnson 変換を使用して、加法的ケースと乗法的ケースの間をスムーズに補間する一連のギャンブルを構築します。
次に、このファミリーに最適な戦略を分析と数値の両方で分析します。
エージェントの資産が増加するにつれて、エージェントのリスク選好を区別することがますます困難になることがわかりました。
これは、異なるリスク選好を持つエージェントが、十分な富を得るために最終的には同じ決定を下すためです。
私たちは、これらの発見は、人間のリスク選好を測定するための効果的な実験計画に有益であると信じています。

要約(オリジナル)

Sequences of repeated gambles provide an experimental tool to characterize the risk preferences of humans or artificial decision-making agents. The difficulty of this inference depends on factors including the details of the gambles offered and the number of iterations of the game played. In this paper we explore in detail the practical challenges of inferring risk preferences from the observed choices of artificial agents who are presented with finite sequences of repeated gambles. We are motivated by the fact that the strategy to maximize long-run wealth for sequences of repeated additive gambles (where gains and losses are independent of current wealth) is different to the strategy for repeated multiplicative gambles (where gains and losses are proportional to current wealth.) Accurate measurement of risk preferences would be needed to tell whether an agent is employing the optimal strategy or not. To generalize the types of gambles our agents face we use the Yeo-Johnson transformation, a tool borrowed from feature engineering for time series analysis, to construct a family of gambles that interpolates smoothly between the additive and multiplicative cases. We then analyze the optimal strategy for this family, both analytically and numerically. We find that it becomes increasingly difficult to distinguish the risk preferences of agents as their wealth increases. This is because agents with different risk preferences eventually make the same decisions for sufficiently high wealth. We believe that these findings are informative for the effective design of experiments to measure risk preferences in humans.

arxiv情報

著者 James Price,Colm Connaughton
発行日 2023-08-14 10:27:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, math.PR パーマリンク