
Nash Learning from Human Feedback

要約 人間のフィードバックからの強化学習 (RLHF) は、大規模言語モデル ( … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.LG, cs.MA, stat.ML | Nash Learning from Human Feedback はコメントを受け付けていません

Nash Learning from Human Feedback

要約 人間のフィードバックからの強化学習 (RLHF) は、大規模言語モデル ( … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.LG, cs.MA, stat.ML | Nash Learning from Human Feedback はコメントを受け付けていません

Energy-based Potential Games for Joint Motion Forecasting and Control

要約 本研究では、ゲーム理論を数学的枠組みとして用い、マルチエージェントの運動予 … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.LG, cs.MA, cs.RO | Energy-based Potential Games for Joint Motion Forecasting and Control はコメントを受け付けていません

Human Choice Prediction in Language-based Non-Cooperative Games: Simulation-based Off-Policy Evaluation

要約 説得ゲームは経済学と AI 研究の基礎であり、実用化に大きく応用されていま … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.LG | Human Choice Prediction in Language-based Non-Cooperative Games: Simulation-based Off-Policy Evaluation はコメントを受け付けていません

On the Complexity of Winner Determination and Strategic Control in Conditional Approval Voting

要約 我々は、Barrot and Lang (2016) によって導入され、優 … 続きを読む

カテゴリー: cs.AI, cs.GT | On the Complexity of Winner Determination and Strategic Control in Conditional Approval Voting はコメントを受け付けていません

Guarantees for Self-Play in Multiplayer Games via Polymatrix Decomposability

要約 セルフプレイは、学習アルゴリズムがそれ自体のコピーと対話することによって学 … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.LG | Guarantees for Self-Play in Multiplayer Games via Polymatrix Decomposability はコメントを受け付けていません

Value Approximation for Two-Player General-Sum Differential Games with State Constraints

要約 ハミルトン・ヤコビ・アイザックス (HJI) 偏微分方程式を解くと、2 プ … 続きを読む

カテゴリー: cs.GT, cs.LG, cs.RO | Value Approximation for Two-Player General-Sum Differential Games with State Constraints はコメントを受け付けていません

Strategyproof and Proportionally Fair Facility Location

要約 私たちは、単純な一次元の集団決定問題 (施設の位置問題と呼ばれることが多い … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.MA, econ.TH | Strategyproof and Proportionally Fair Facility Location はコメントを受け付けていません

Generative Social Choice

要約 従来、社会的選択理論は、あらかじめ決められたいくつかの選択肢の中からの選択 … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.LG | Generative Social Choice はコメントを受け付けていません

Exploring Trust and Risk during Online Bartering Interactions

要約 この論文では、リスクが人々の物々交換の方法にどのような影響を与えるかを調査 … 続きを読む

カテゴリー: cs.GT, cs.RO | Exploring Trust and Risk during Online Bartering Interactions はコメントを受け付けていません