Learning Optimal Prescriptive Trees from Observational Data

要約

観察データから中程度の深さの最適な規範ツリー (つまり、二分木の形式で解釈可能な治療割り当てポリシー) を学習する問題を検討します。
この問題は、公衆衛生や個別化医療など、多くの社会的に重要な領域で発生します。そこでは、無作為化試験からではなく、導入時に収集されたデータに基づいて、つまり受動的なデータ収集を通じて、解釈可能なデータ駆動型の介入が求められています。
混合整数最適化 (MIO) 技術を使用して最適な規範ツリーを学習する方法を提案します。
穏やかな条件下では、履歴データのサンプル数が無限大になる傾向があるため、最適なサンプル外治療割り当てポリシーに収束するという意味で、この方法が漸近的に正確であることを示します。
既存の文献とは対照的に、私たちのアプローチは、1) データをランダム化する必要がなく、2) 学習されたツリーに厳密な仮定を課さず、3) ドメイン固有の制約をモデル化する機能を備えています。
広範な計算実験を通じて、漸近保証が有限サンプルでの大幅なパフォーマンス向上につながることを実証するとともに、予算と公平性の制約を組み込むことで独自の柔軟なモデリング能力を実証します。

要約(オリジナル)

We consider the problem of learning an optimal prescriptive tree (i.e., an interpretable treatment assignment policy in the form of a binary tree) of moderate depth, from observational data. This problem arises in numerous socially important domains such as public health and personalized medicine, where interpretable and data-driven interventions are sought based on data gathered in deployment — through passive collection of data — rather than from randomized trials. We propose a method for learning optimal prescriptive trees using mixed-integer optimization (MIO) technology. We show that under mild conditions our method is asymptotically exact in the sense that it converges to an optimal out-of-sample treatment assignment policy as the number of historical data samples tends to infinity. Contrary to existing literature, our approach: 1) does not require data to be randomized, 2) does not impose stringent assumptions on the learned trees, and 3) has the ability to model domain specific constraints. Through extensive computational experiments, we demonstrate that our asymptotic guarantees translate to significant performance improvements in finite samples, as well as showcase our uniquely flexible modeling power by incorporating budget and fairness constraints.

arxiv情報

著者 Nathanael Jo,Sina Aghaei,Andrés Gómez,Phebe Vayanos
発行日 2023-07-24 15:31:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CY, cs.LG, stat.ML パーマリンク