Proportional Aggregation of Preferences for Sequential Decision Making

要約

私たちは、有権者の好みを考慮した公正な逐次的意思決定の問題を研究します。
各ラウンドで、決定ルールは一連の選択肢から決定を選択する必要があり、各有権者はこれらの選択肢のうちどれを承認するかを報告します。
各ラウンドで最も人気のある選択肢を選択する代わりに、比例代表を目指します。
我々は、複数の勝者の投票に関する文献で提案され、最近複数の争点の意思決定に適応された比例正当化表現 (PJR) に基づく公理を使用してこの目的を形式化します。
公理では、有権者の $\alpha\%$ のすべてのグループがすべてのラウンドで同意する (つまり、共通の代替案を承認する) 場合、それらの有権者は少なくとも $\alpha\%$ の決定を承認する必要があります。
公理のより強力なバージョンでは、ラウンドの $\beta$ 部分で同意する有権者の $\alpha\%$ のすべてのグループが $\beta\cdot\alpha\%$ の決定を承認する必要があります。
3 つの魅力的な投票ルールがこのスタイルの公理を満たすことを示します。
そのうちの 1 つ (Sequential Phragm\’en) はオンラインで意思決定を行い、他の 2 つは公理の強化バージョンを満たしますが、意思決定は半オンライン (均等株式法) または完全にオフライン (比例承認投票) で行われます。
最初の 2 つは多項式時間で計算可能で、後者は NP ハード最適化に基づいていますが、同じ公理的特性を満たす多項式時間の局所探索アルゴリズムが認められます。
合成データと米国の政治選挙に基づいて、これらのルールのパフォーマンスに関する実証結果を示します。
また、倫理的ジレンマに関するモラル マシン データセットからのユーザーの応答に基づいてトレーニングされた選好モデルによって投票が行われる実験も実行します。

要約(オリジナル)

We study the problem of fair sequential decision making given voter preferences. In each round, a decision rule must choose a decision from a set of alternatives where each voter reports which of these alternatives they approve. Instead of going with the most popular choice in each round, we aim for proportional representation. We formalize this aim using axioms based on Proportional Justified Representation (PJR), which were proposed in the literature on multi-winner voting and were recently adapted to multi-issue decision making. The axioms require that every group of $\alpha\%$ of the voters, if it agrees in every round (i.e., approves a common alternative), then those voters must approve at least $\alpha\%$ of the decisions. A stronger version of the axioms requires that every group of $\alpha\%$ of the voters that agrees in a $\beta$ fraction of rounds must approve $\beta\cdot\alpha\%$ of the decisions. We show that three attractive voting rules satisfy axioms of this style. One of them (Sequential Phragm\’en) makes its decisions online, and the other two satisfy strengthened versions of the axioms but make decisions semi-online (Method of Equal Shares) or fully offline (Proportional Approval Voting). The first two are polynomial-time computable, and the latter is based on an NP-hard optimization, but it admits a polynomial-time local search algorithm that satisfies the same axiomatic properties. We present empirical results about the performance of these rules based on synthetic data and U.S. political elections. We also run experiments where votes are cast by preference models trained on user responses from the moral machine dataset about ethical dilemmas.

arxiv情報

著者 Nikhil Chandak,Shashwat Goel,Dominik Peters
発行日 2023-06-26 17:10:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.GT, cs.LG パーマリンク