Tree Ensembles for Contextual Bandits

要約

我々は、木のアンサンブルに基づく文脈多腕バンディットの新しい枠組みを提案する。本フレームワークは、広く用いられている2つのバンディット手法、Upper Confidence BoundとThompson Samplingを、標準的な設定と組み合わせ設定の両方に適応させたものである。このフレームワークの一部として、木アンサンブル予測における不確実性を推定する新しい方法を提案する。さらに、XGBoostとランダムフォレストという2つの一般的な樹木アンサンブル手法を用いた実験により、本フレームワークの有効性を実証する。決定木やニューラルネットワークに基づく最先端の手法と比較して、我々の手法は、ベンチマークデータセットや、道路ネットワーク上のナビゲーションという実世界のアプリケーションに適用した場合、後悔の最小化と計算実行時間の両面で優れた性能を示す。

要約(オリジナル)

We propose a new framework for contextual multi-armed bandits based on tree ensembles. Our framework adapts two widely used bandit methods, Upper Confidence Bound and Thompson Sampling, for both standard and combinatorial settings. As part of this framework, we propose a novel method of estimating the uncertainty in tree ensemble predictions. We further demonstrate the effectiveness of our framework via several experimental studies, employing XGBoost and random forests, two popular tree ensemble methods. Compared to state-of-the-art methods based on decision trees and neural networks, our methods exhibit superior performance in terms of both regret minimization and computational runtime, when applied to benchmark datasets and the real-world application of navigation over road networks.

arxiv情報

著者 Hannes Nilsson,Rikard Johansson,Niklas Åkerblom,Morteza Haghir Chehreghani
発行日 2024-11-01 11:46:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.LG, stat.ML パーマリンク