要約
オフポリシー評価 (OPE) は、オフライン データセットから新しい製品やポリシーの有効性を評価するために、製薬や電子商取引などの分野で広く適用されています。
この論文では、時空間干渉を扱う既存の OPE 方法論で一般的である、いくつかの重要な構造仮定、主に平均場の仮定を緩和する因果的ディープセット フレームワークを紹介します。
これらの従来の仮定は、現実世界の設定では不適切であることが頻繁に判明し、その結果、複雑な干渉の影響に効果的に対処するための現在の OPE 手法の能力が制限されます。
これに応えて、私たちは順列不変性 (PI) 仮定の実装を主張します。
この革新的なアプローチにより、平均場関数のデータ駆動型の適応学習が可能になり、従来の平均化を超えたより柔軟な推定方法が提供されます。
さらに、PI 仮定を OPE に組み込んだ新しいアルゴリズムを提示し、その理論的基礎を徹底的に検証します。
私たちの数値分析は、この新しいアプローチが既存のベースライン アルゴリズムよりも大幅に正確な推定をもたらし、それによって OPE 方法論の実際の適用性と有効性が大幅に向上することを示しています。
私たちが提案する方法の Python 実装は、https://github.com/BIG-S2/Causal-Deepsets で入手できます。
要約(オリジナル)
Off-policy evaluation (OPE) is widely applied in sectors such as pharmaceuticals and e-commerce to evaluate the efficacy of novel products or policies from offline datasets. This paper introduces a causal deepset framework that relaxes several key structural assumptions, primarily the mean-field assumption, prevalent in existing OPE methodologies that handle spatio-temporal interference. These traditional assumptions frequently prove inadequate in real-world settings, thereby restricting the capability of current OPE methods to effectively address complex interference effects. In response, we advocate for the implementation of the permutation invariance (PI) assumption. This innovative approach enables the data-driven, adaptive learning of the mean-field function, offering a more flexible estimation method beyond conventional averaging. Furthermore, we present novel algorithms that incorporate the PI assumption into OPE and thoroughly examine their theoretical foundations. Our numerical analyses demonstrate that this novel approach yields significantly more precise estimations than existing baseline algorithms, thereby substantially improving the practical applicability and effectiveness of OPE methodologies. A Python implementation of our proposed method is available at https://github.com/BIG-S2/Causal-Deepsets.
arxiv情報
著者 | Runpeng Dai,Jianing Wang,Fan Zhou,Shikai Luo,Zhiwei Qin,Chengchun Shi,Hongtu Zhu |
発行日 | 2024-07-25 10:02:11+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google