Strategyproof Decision-Making in Panel Data Settings and Beyond

要約

意思決定者が複数のユニット (またはエージェント) の測定を繰り返してノイズを得るという、パネル データを使用した意思決定の問題について考えます。
介入前の期間があり、校長が各単元の結果を観察し、その後、校長がこれらの観察を使用して各単元に治療を割り当てるという設定を検討します。
この古典的な設定とは異なり、パネル データを生成するユニットが戦略的であることを許可します。つまり、ユニットはより望ましい介入を受けるために介入前の結果を変更することができます。
プリンシパルの目標は、戦略性のない介入ポリシー、つまり、戦略化の可能性があるにもかかわらず、ユーティリティを最大化する介入にユニットを割り当てるポリシーを設計することです。
我々はまず、戦略性のない介入政策が存在するための必要十分条件を特定し、戦略性が存在する場合には、単純な閉じた形式で戦略性のメカニズムを提供します。
その過程で、戦略的なマルチクラス分類が不可能であることを証明しますが、これは独立した利益となる可能性があります。
2 つの介入がある場合、戦略に耐えるメカニズムが常に存在することを確立し、そのようなメカニズムを学習するためのアルゴリズムを提供します。
3 つ以上の介入については、異なる介入間のプリンシパルの報酬に十分に大きなギャップが存在する場合に、戦略に耐えるメカニズムを学習するためのアルゴリズムを提供します。
最後に、18 か月にわたる製品販売から収集された実際のパネル データを使用してモデルを実証的に評価します。
私たちの方法は、モデルの仕様に誤りがある場合でも、戦略的相互作用を考慮していないベースラインと比較して有利であることがわかりました。

要約(オリジナル)

We consider the problem of decision-making using panel data, in which a decision-maker gets noisy, repeated measurements of multiple units (or agents). We consider a setup where there is a pre-intervention period, when the principal observes the outcomes of each unit, after which the principal uses these observations to assign a treatment to each unit. Unlike this classical setting, we permit the units generating the panel data to be strategic, i.e. units may modify their pre-intervention outcomes in order to receive a more desirable intervention. The principal’s goal is to design a strategyproof intervention policy, i.e. a policy that assigns units to their utility-maximizing interventions despite their potential strategizing. We first identify a necessary and sufficient condition under which a strategyproof intervention policy exists, and provide a strategyproof mechanism with a simple closed form when one does exist. Along the way, we prove impossibility results for strategic multiclass classification, which may be of independent interest. When there are two interventions, we establish that there always exists a strategyproof mechanism, and provide an algorithm for learning such a mechanism. For three or more interventions, we provide an algorithm for learning a strategyproof mechanism if there exists a sufficiently large gap in the principal’s rewards between different interventions. Finally, we empirically evaluate our model using real-world panel data collected from product sales over 18 months. We find that our methods compare favorably to baselines which do not take strategic interactions into consideration, even in the presence of model misspecification.

arxiv情報

著者 Keegan Harris,Anish Agarwal,Chara Podimata,Zhiwei Steven Wu
発行日 2023-12-21 15:17:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.GT, cs.LG, econ.EM パーマリンク