要約
目標が矛盾するシナリオで効果的な意思決定をサポートするために、最適と思われる一連のソリューションを意思決定者に提示できます。
これらのセットにどのようなポリシーを含めるべきか、またそのようなセットをどのように効率的に計算できるかを調査します。
これを念頭に置いて、私たちは分布アプローチを採用し、保険契約の収益分布に直接関連する新しい支配基準を導入します。
この基準に基づいて、分布の支配されていないセットを提示し、それがなければパレート フロントによって無視される最適なポリシーが含まれていることを示します。
さらに、凸分布非支配集合を提案し、それが多変量リスク回避意思決定者にとって期待される効用を最大化するすべてのポリシーを構成していることを証明します。
我々は、分布非支配集合を学習し、集合を凸分布非支配集合に減らす枝刈り演算子をさらに提供する新しいアルゴリズムを提案します。
私たちは実験を通じてこれらの方法の実現可能性と有効性を実証し、これを現実世界の問題における意思決定支援のための価値ある新しいアプローチにしています。
要約(オリジナル)
For effective decision support in scenarios with conflicting objectives, sets of potentially optimal solutions can be presented to the decision maker. We explore both what policies these sets should contain and how such sets can be computed efficiently. With this in mind, we take a distributional approach and introduce a novel dominance criterion relating return distributions of policies directly. Based on this criterion, we present the distributional undominated set and show that it contains optimal policies otherwise ignored by the Pareto front. In addition, we propose the convex distributional undominated set and prove that it comprises all policies that maximise expected utility for multivariate risk-averse decision makers. We propose a novel algorithm to learn the distributional undominated set and further contribute pruning operators to reduce the set to the convex distributional undominated set. Through experiments, we demonstrate the feasibility and effectiveness of these methods, making this a valuable new approach for decision support in real-world problems.
arxiv情報
著者 | Willem Röpke,Conor F. Hayes,Patrick Mannion,Enda Howley,Ann Nowé,Diederik M. Roijers |
発行日 | 2023-07-18 10:59:46+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google