月別アーカイブ: 2024年5月

Policy Space Response Oracles: A Survey

要約 ゲーム理論は、複数の意思決定者間の相互作用を研究する数学的方法を提供します … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.MA | Policy Space Response Oracles: A Survey はコメントを受け付けていません

Exploring and steering the moral compass of Large Language Models

要約 大規模言語モデル (LLM) は、さまざまな分野にわたって自動化と意思決定 … 続きを読む

カテゴリー: cs.AI, cs.CL | Exploring and steering the moral compass of Large Language Models はコメントを受け付けていません

Prompt Optimization with Human Feedback

要約 大規模言語モデル (LLM) は、さまざまなタスクで顕著なパフォーマンスを … 続きを読む

カテゴリー: cs.AI, cs.LG | Prompt Optimization with Human Feedback はコメントを受け付けていません

Why Transformers Need Adam: A Hessian Perspective

要約 『トランスフォーマー』ではSGDのパフォーマンスがアダムより大幅に劣ってい … 続きを読む

カテゴリー: cs.AI, cs.LG | Why Transformers Need Adam: A Hessian Perspective はコメントを受け付けていません

Rethinking Transformers in Solving POMDPs

要約 現実世界のシナリオにおける強化学習 (RL) などの逐次意思決定アルゴリズ … 続きを読む

カテゴリー: cs.AI, cs.LG | Rethinking Transformers in Solving POMDPs はコメントを受け付けていません

Generating Likely Counterfactuals Using Sum-Product Networks

要約 AI システムによる意思決定の説明可能性は、最近の規制とユーザーの需要の両 … 続きを読む

カテゴリー: cs.AI, cs.LG, math.OC | Generating Likely Counterfactuals Using Sum-Product Networks はコメントを受け付けていません

A Theoretical Framework for Partially Observed Reward-States in RLHF

要約 ヒューマン フィードバックからの強化学習 (RLHF) の展開の拡大には、 … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | A Theoretical Framework for Partially Observed Reward-States in RLHF はコメントを受け付けていません

BehaviorGPT: Smart Agent Simulation for Autonomous Driving with Next-Patch Prediction

要約 自動運転システムの安全性を効率的に検証するには、交通エージェント間の現実的 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | BehaviorGPT: Smart Agent Simulation for Autonomous Driving with Next-Patch Prediction はコメントを受け付けていません

MindMerger: Efficient Boosting LLM Reasoning in non-English Languages

要約 推論機能は大規模言語モデル (LLM) にとって重要ですが、英語と英語以外 … 続きを読む

カテゴリー: cs.AI, cs.CL | MindMerger: Efficient Boosting LLM Reasoning in non-English Languages はコメントを受け付けていません

Transformers Can Do Arithmetic with the Right Embeddings

要約 算術タスクにおけるトランスフォーマーのパフォーマンスの低下は、大きな桁範囲 … 続きを読む

カテゴリー: cs.AI, cs.LG | Transformers Can Do Arithmetic with the Right Embeddings はコメントを受け付けていません