Active Learning for Non-Parametric Choice Models

要約

私たちは、消費者の決定に基づいてノンパラメトリック選択モデルを能動的に学習する問題を研究します。
我々は、そのような選択モデルが識別できない可能性があることを示す否定的な結果を提示します。
識別可能性の問題を克服するために、選択モデルの有向非巡回グラフ (DAG) 表現を導入します。
この表現は、すべての選択確率の計算を可能にするという意味で、利用可能なデータから推測できる選択モデルに関するすべての情報をエンコードしていると考えられます。
項目セットのコレクションに対する正確な選択確率が与えられると、DAG を再構築できることを確立します。
ただし、この方法を拡張して、能動学習プロセス中に取得されたノイズの多い選択周波数データから DAG を推定しようとすると、不正確さが生じます。
この課題に対処するために、DAG レベル全体にわたるエラー伝播を効果的に管理し、DAG のより正確な推定につながる包含/除外アプローチを提案します。
この手法を利用して、私たちのアルゴリズムは、基礎となるノンパラメトリック選択モデルの DAG 表現を推定します。
このアルゴリズムは、頻繁に使用されるランキングのセットが均一にランダムに描画される場合、(多項式時間で) 効率的に動作します。
さまざまな商品を積極的かつ繰り返し提供し、選択された商品を観察することで、頻繁に使用する嗜好タイプの中で最も人気のある商品の分布を学習します。
私たちのアルゴリズムは、対応する非能動学習推定アルゴリズムと比較して、消費者の嗜好に関する合成データセットと公的に利用可能なデータセットの両方で、頻繁に使用される嗜好のセットをより効果的に回復することを実証します。
これらの発見は、私たちのアルゴリズムの価値と、消費者行動のモデル化におけるアクティブラーニングアプローチのより幅広い適用可能性を強調しています。

要約(オリジナル)

We study the problem of actively learning a non-parametric choice model based on consumers’ decisions. We present a negative result showing that such choice models may not be identifiable. To overcome the identifiability problem, we introduce a directed acyclic graph (DAG) representation of the choice model. This representation provably encodes all the information about the choice model which can be inferred from the available data, in the sense that it permits computing all choice probabilities. We establish that given exact choice probabilities for a collection of item sets, one can reconstruct the DAG. However, attempting to extend this methodology to estimate the DAG from noisy choice frequency data obtained during an active learning process leads to inaccuracies. To address this challenge, we present an inclusion-exclusion approach that effectively manages error propagation across DAG levels, leading to a more accurate estimate of the DAG. Utilizing this technique, our algorithm estimates the DAG representation of an underlying non-parametric choice model. The algorithm operates efficiently (in polynomial time) when the set of frequent rankings is drawn uniformly at random. It learns the distribution over the most popular items among frequent preference types by actively and repeatedly offering assortments of items and observing the chosen item. We demonstrate that our algorithm more effectively recovers a set of frequent preferences on both synthetic and publicly available datasets on consumers’ preferences, compared to corresponding non-active learning estimation algorithms. These findings underscore the value of our algorithm and the broader applicability of active-learning approaches in modeling consumer behavior.

arxiv情報

著者 Fransisca Susan,Negin Golrezaei,Ehsan Emamjomeh-Zadeh,David Kempe
発行日 2024-04-25 13:16:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DS, cs.LG, math.OC, math.PR, stat.ML パーマリンク