Planning to Fairly Allocate: Probabilistic Fairness in the Restless Bandit Setting

要約

落ち着きがなく倒れるバンディットは、患者間の健康介入の割り当てなど、アームの行動に依存した移行確率がある設定で、予算に制約のあるリソース割り当てをモデル化するためによく使用されます。
しかし、この計画問題に対する最先端のホイットル指数ベースのアプローチは、兵器間の公平性を考慮していないか、公平性を保証せずに奨励しているかのどちらかです。
そこで、各タイムステップで引き出される確率に厳密に正の下限を確保しながら、期待される報酬の合計を最大化し、予算の制約を満たす、確率的に公平なポリシーである ProbFair を導入します。
私たちは、介入が患者の持続的気道陽圧 (CPAP) 療法のアドヒアランスをサポートする現実世界のアプリケーションと、より広範なクラスの合成遷移行列でアルゴリズムを評価します。
ProbFair は公平性を保証しながら実用性を維持していることがわかりました。

要約(オリジナル)

Restless and collapsing bandits are often used to model budget-constrained resource allocation in settings where arms have action-dependent transition probabilities, such as the allocation of health interventions among patients. However, state-of-the-art Whittle-index-based approaches to this planning problem either do not consider fairness among arms, or incentivize fairness without guaranteeing it. We thus introduce ProbFair, a probabilistically fair policy that maximizes total expected reward and satisfies the budget constraint while ensuring a strictly positive lower bound on the probability of being pulled at each timestep. We evaluate our algorithm on a real-world application, where interventions support continuous positive airway pressure (CPAP) therapy adherence among patients, as well as on a broader class of synthetic transition matrices. We find that ProbFair preserves utility while providing fairness guarantees.

arxiv情報

著者 Christine Herlihy,Aviva Prins,Aravind Srinivasan,John P. Dickerson
発行日 2023-07-19 14:45:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CY, cs.LG パーマリンク