
Nash Learning from Human Feedback

要約 人間のフィードバックからの強化学習 (RLHF) は、大規模言語モデル ( … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.LG, cs.MA, stat.ML | Nash Learning from Human Feedback はコメントを受け付けていません

GemNet: Menu-Based, Strategy-Proof Multi-Bidder Auctions Through Deep Learning

要約 微分可能経済学では、深層学習を使用して自動メカニズム設計を行います。 大き … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.LG | GemNet: Menu-Based, Strategy-Proof Multi-Bidder Auctions Through Deep Learning はコメントを受け付けていません

Automating Food Drop: The Power of Two Choices for Dynamic and Fair Food Allocation

要約 食料廃棄と食料不安は、密接に関連する 2 つの差し迫った世界的問題です。 … 続きを読む

カテゴリー: cs.AI, cs.GT | Automating Food Drop: The Power of Two Choices for Dynamic and Fair Food Allocation はコメントを受け付けていません

From Stream to Pool: Pricing Under the Law of Diminishing Marginal Utility

要約 動的価格設定モデルでは、多くの場合、$\textbf{stream}$ の … 続きを読む

カテゴリー: cs.GT, cs.LG | From Stream to Pool: Pricing Under the Law of Diminishing Marginal Utility はコメントを受け付けていません

Robust Reward Design for Markov Decision Processes

要約 報酬設計の問題では、リーダーとフォロワーの間の相互作用を調べます。リーダー … 続きを読む

カテゴリー: cs.AI, cs.GT, math.OC | Robust Reward Design for Markov Decision Processes はコメントを受け付けていません

Quantifying Misalignment Between Agents

要約 近年、AI アライメント問題に対する懸念が高まっており、これまでの研究では … 続きを読む

カテゴリー: cs.AI, cs.CY, cs.GT, cs.MA, I.2.11 | Quantifying Misalignment Between Agents はコメントを受け付けていません

Solution Concepts in Hierarchical Games under Bounded Rationality with Applications to Autonomous Driving

要約 自動運転車 (AV) が通常の人間の交通にさらに統合されるようになるにつれ … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.MA, cs.RO, I.2.0 | Solution Concepts in Hierarchical Games under Bounded Rationality with Applications to Autonomous Driving はコメントを受け付けていません

Minimally Modifying a Markov Game to Achieve Any Nash Equilibrium and Value

要約 私たちは、善意のゲーム設計者または悪意のある敵対者が、ターゲットの決定論的 … 続きを読む

カテゴリー: cs.AI, cs.GT | Minimally Modifying a Markov Game to Achieve Any Nash Equilibrium and Value はコメントを受け付けていません

State-Constrained Zero-Sum Differential Games with One-Sided Information

要約 私たちは、状態制約と一方的な情報を備えたゼロサム差分ゲームを研究します。こ … 続きを読む

カテゴリー: cs.GT, cs.LG | State-Constrained Zero-Sum Differential Games with One-Sided Information はコメントを受け付けていません

Social Choice Should Guide AI Alignment in Dealing with Diverse Human Feedback

要約 GPT-4 などの財団モデルは、犯罪の幇助や人種差別的なテキストの作成など … 続きを読む

カテゴリー: 68T01, 68T50, 91B12, 91B14, cs.AI, cs.CL, cs.CY, cs.GT, cs.LG, I.2.0 | Social Choice Should Guide AI Alignment in Dealing with Diverse Human Feedback はコメントを受け付けていません