Causal Bandits without Graph Learning

要約

私たちは、因果グラフが不明な場合の因果バンディット問題を研究し、アトミック介入を使用して報酬ノードの親ノードを見つけるための効率的なアルゴリズムを開発します。
アルゴリズムによって実行される介入の予想数の正確な方程式を導出し、特定のグラフィック条件下では対数的に高速に実行できるか、より一般的な仮定の下では変数の数が線形よりも遅くても実行できることを示します。
私たちのアルゴリズムは、アトミックな介入を実行するアルゴリズムに対して確立した普遍的な下限を満たすため、最適であることを正式に示します。
最後に、報酬ノードに複数の親がある場合にアルゴリズムを拡張します。
このアルゴリズムを Bandit 文献の標準アルゴリズムと併用すると、リグレス限界が改善されます。

要約(オリジナル)

We study the causal bandit problem when the causal graph is unknown and develop an efficient algorithm for finding the parent node of the reward node using atomic interventions. We derive the exact equation for the expected number of interventions performed by the algorithm and show that under certain graphical conditions it could perform either logarithmically fast or, under more general assumptions, slower but still sublinearly in the number of variables. We formally show that our algorithm is optimal as it meets the universal lower bound we establish for any algorithm that performs atomic interventions. Finally, we extend our algorithm to the case when the reward node has multiple parents. Using this algorithm together with a standard algorithm from bandit literature leads to improved regret bounds.

arxiv情報

著者 Mikhail Konobeev,Jalal Etesami,Negar Kiyavash
発行日 2023-06-08 17:11:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク