Learning Personalized Decision Support Policies

要約

タイトル:個人化意思決定支援方針の学習
要約:
– 個人の意思決定者は、意思決定の結果を改善するために異なる形式の支援を受けることができます。
– しかし、重要な問題は、どの形式の支援が低コストで正確な意思決定を導くかということです。
– この研究では、与えられた入力に対して、必要に応じてどの形式の支援を提供するかを決定する決定支援方針を学習することを提案しています。
– 事前情報がない意思決定者を対象に、正確性とコストのトレードオフを考慮した多目的最適化問題として、それぞれの方針を学習することを形式化します。
– 確率的コンテキストバンディットの技術を用いて、各意思決定者のための個別の意思決定支援方針を個人化するオンラインアルゴリズムである「THREAD」を提案し、シミュレートされた人間の行動を使用してコストパフォーマンスのトレードオフを特定するためのハイパーパラメータ調整戦略を考案しています。
– オフラインベースラインと比較した場合、THREADの利点を示す計算実験を提供します。
– 次に、THREADにインターフェースを提供する対話型ツールである「Modiste」を紹介します。
– 実際のユーザーに対してオンラインで意思決定支援方針を学習するニュアンスを議論し、Modisteが各意思決定者に個人化された方針を学習する方法を示す人間実験を行います。

要約(オリジナル)

Individual human decision-makers may benefit from different forms of support to improve decision outcomes. However, a key question is which form of support will lead to accurate decisions at a low cost. In this work, we propose learning a decision support policy that, for a given input, chooses which form of support, if any, to provide. We consider decision-makers for whom we have no prior information and formalize learning their respective policies as a multi-objective optimization problem that trades off accuracy and cost. Using techniques from stochastic contextual bandits, we propose $\texttt{THREAD}$, an online algorithm to personalize a decision support policy for each decision-maker, and devise a hyper-parameter tuning strategy to identify a cost-performance trade-off using simulated human behavior. We provide computational experiments to demonstrate the benefits of $\texttt{THREAD}$ compared to offline baselines. We then introduce $\texttt{Modiste}$, an interactive tool that provides $\texttt{THREAD}$ with an interface. We conduct human subject experiments to show how $\texttt{Modiste}$ learns policies personalized to each decision-maker and discuss the nuances of learning decision support policies online for real users.

arxiv情報

著者 Umang Bhatt,Valerie Chen,Katherine M. Collins,Parameswaran Kamalaruban,Emma Kallina,Adrian Weller,Ameet Talwalkar
発行日 2023-04-13 17:53:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.CY, cs.HC, cs.LG パーマリンク