A Counterfactual Analysis of the Dishonest Casino

要約

不正なカジノは、HMMSとグラフィカルモデルを導入するために教育環境で使用される有名な隠しマルコフモデル(HMM)です。
ここでは、ダイロールの​​シーケンスが観察され、カジノはフェアとロードされたダイを切り替えます。
通常、目標は、観測されたロールを使用して、公正およびロードされたサイコロのパターンを推測し、フィルタリング、スムージング、およびViterBiアルゴリズムにつながることです。
ただし、このホワイトペーパーでは、賞金のどれだけがカジノの不正行為に起因するものであることを調査します。
これに対処するために、HMMと一致する構造的因果モデル(SCM)を導入し、不正行為(EWAC)(部分的に識別可能な)に起因する予想される賞金を線形プログラム(LPS)を使用して境界することができます。
数値実験を通じて、これらの境界を計算し、独立性、コモントニック、およびモノトニックのコピュラに基づいてベンチマークSCMを使用して直感を開発します。
SCMの時程度の状態でより緊密な境界が得られることを示しますが、緩い境界により、ほぼ明示的なLPソリューションが可能になります。
経路ごとの単調性や反事実的安定性などのドメイン固有の知識は、線形制約を介して組み込むことができます。
また、期間数が無限になるため、EWACが制限において完全に識別できる時間平均を示します。
私たちの仕事は、因果的推論における境界の反事実に貢献し、ダイナミックなHMM設定でLPの境界を開発した最初のものであり、反事実的な推論が教えられる教育的文脈に利益をもたらします。

要約(オリジナル)

The dishonest casino is a well-known hidden Markov model (HMM) used in educational settings to introduce HMMs and graphical models. Here, a sequence of die rolls is observed, with the casino switching between a fair and a loaded die. Typically, the goal is to use the observed rolls to infer the pattern of fair and loaded dice, leading to filtering, smoothing, and Viterbi algorithms. This paper, however, explores how much of the winnings is attributable to the casino’s cheating, a counterfactual question beyond the scope of HMM primitives. To address this, we introduce a structural causal model (SCM) consistent with the HMM and show the expected winnings attributable to cheating (EWAC) (which is only partially identifiable) can be bounded using linear programs (LPs). Through numerical experiments, we compute these bounds and develop intuition using benchmark SCMs based on independence, comonotonic, and counter-monotonic copulas. We show that tighter bounds are obtained with a time-homogeneity condition on the SCM, while looser bounds allow for an almost explicit LP solution. Domain-specific knowledge such as pathwise monotonicity or counterfactual stability can be incorporated via linear constraints. We also show the time-average EWAC is fully identifiable in the limit as the number of time periods goes to infinity. Our work contributes to bounding counterfactuals in causal inference and is the first to develop LP bounds in a dynamic HMM setting, benefiting educational contexts where counterfactual inference is taught.

arxiv情報

著者 Martin Haugh,Raghav Singal
発行日 2025-02-27 17:01:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク