要約
一か八かの意思決定の多くは、人間のオペレーターがアルゴリズムから推奨事項を受け取りますが、最終的な意思決定者であるという点で、エキスパートインループ構造に従います。
したがって、アルゴリズムの推奨事項は、実際に実装される実際の決定とは異なる場合があります。
ただし、アルゴリズムによる推奨事項のほとんどは、推奨事項が完全に実装されることを前提とした最適化問題を解くことによって取得されます。
推奨ポリシーと実装ポリシーの間の二項対立を捉え、部分的な遵守が最適な推奨に及ぼす影響を分析するため、遵守を意識した最適化フレームワークを提案します。
現在、ほとんどのレコメンデーション エンジンで行われているように、部分的な遵守現象を見逃すと、現在の人間のベースライン パフォーマンスとレコメンデーション アルゴリズムによって期待されるパフォーマンスの両方と比較して、任意に深刻なパフォーマンスの低下につながる可能性があることを示します。
私たちのフレームワークは、構造を分析し、そのような人間による逸脱の影響を自然に受けず、ベースライン ポリシーを改善することが保証された最適な推奨ポリシーを計算するための便利なツールも提供します。
要約(オリジナル)
Many high-stake decisions follow an expert-in-loop structure in that a human operator receives recommendations from an algorithm but is the ultimate decision maker. Hence, the algorithm’s recommendation may differ from the actual decision implemented in practice. However, most algorithmic recommendations are obtained by solving an optimization problem that assumes recommendations will be perfectly implemented. We propose an adherence-aware optimization framework to capture the dichotomy between the recommended and the implemented policy and analyze the impact of partial adherence on the optimal recommendation. We show that overlooking the partial adherence phenomenon, as is currently being done by most recommendation engines, can lead to arbitrarily severe performance deterioration, compared with both the current human baseline performance and what is expected by the recommendation algorithm. Our framework also provides useful tools to analyze the structure and to compute optimal recommendation policies that are naturally immune against such human deviations, and are guaranteed to improve upon the baseline policy.
arxiv情報
著者 | Julien Grand-Clément,Jean Pauphilet |
発行日 | 2023-06-16 16:20:05+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google