Mitigating optimistic bias in entropic risk estimation and optimization with an application to insurance

要約

エントロピー リスク尺度は、不確実な損失に伴うテール リスクを考慮するために、一か八かの意思決定で広く使用されています。
データが限られている場合、経験的なエントロピー リスク推定量、つまりエントロピー リスク尺度の期待値をサンプル平均に置き換えると、真のリスクが過小評価されます。
経験的なエントロピー リスク推定量のバイアスを軽減するために、強く漸近的に一貫したブートストラップ手順を提案します。
手順の最初のステップでは、分布をデータに当てはめることが含まれます。一方、2 番目のステップでは、ブートストラップを使用して経験的エントロピー リスク推定量のバイアスを推定し、それを補正します。
ガウス混合モデルをデータに適合させるために 2 つの方法が提案されています。1 つは経験的なエントロピー リスクの分布に適合する計算集約型の方法、もう 1 つは経験的分布の裾に適合するコンポーネントを使用するより単純な方法です。
私たちのアプローチの応用として、type-$\infty$ Wasserstein 曖昧性セットを使用して分布的にロバストなエントロピー リスク最小化問題を研究し、バイアス補正をデバイアス検証パフォーマンスに適用します。
さらに、世帯全体の損失の相関関係を考慮した、保険契約設計問題に対する分布的にロバストな最適化モデルを提案します。
相互検証方法に基づいて正則化パラメータを選択すると、検証パフォーマンスの偏りが補正されない場合、保険会社のサンプル外リスクが大幅に高くなる可能性があることを示します。
このパフォーマンスの向上は、私たちの手法が住宅所有者に対してより高い (そしてより正確な) プレミアムを示唆しているという観察から説明できます。

要約(オリジナル)

The entropic risk measure is widely used in high-stakes decision making to account for tail risks associated with an uncertain loss. With limited data, the empirical entropic risk estimator, i.e. replacing the expectation in the entropic risk measure with a sample average, underestimates the true risk. To mitigate the bias in the empirical entropic risk estimator, we propose a strongly asymptotically consistent bootstrapping procedure. The first step of the procedure involves fitting a distribution to the data, whereas the second step estimates the bias of the empirical entropic risk estimator using bootstrapping, and corrects for it. Two methods are proposed to fit a Gaussian Mixture Model to the data, a computationally intensive one that fits the distribution of empirical entropic risk, and a simpler one with a component that fits the tail of the empirical distribution. As an application of our approach, we study distributionally robust entropic risk minimization problems with type-$\infty$ Wasserstein ambiguity set and apply our bias correction to debias validation performance. Furthermore, we propose a distributionally robust optimization model for an insurance contract design problem that takes into account the correlations of losses across households. We show that choosing regularization parameters based on the cross validation methods can result in significantly higher out-of-sample risk for the insurer if the bias in validation performance is not corrected for. This improvement in performance can be explained from the observation that our methods suggest a higher (and more accurate) premium to homeowners.

arxiv情報

著者 Utsav Sadana,Erick Delage,Angelos Georghiou
発行日 2024-12-25 12:45:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.OC, stat.ML パーマリンク