-
最近の投稿
- Unified Multimodal Discrete Diffusion
- A Study of Perceived Safety for Soft Robotics in Caregiving Tasks
- Pellet-based 3D Printing of Soft Thermoplastic Elastomeric Membranes for Soft Robotic Applications
- SimBEV: A Synthetic Multi-Task Multi-Sensor Driving Data Generation Tool and Dataset
- Multi-Agent Inverse Reinforcement Learning in Real World Unstructured Pedestrian Crowds
-
最近のコメント
表示できるコメントはありません。 cs.AI (35797) cs.CL (27063) cs.CR (2730) cs.CV (41653) cs.LG (40744) cs.RO (21106) cs.SY (3195) eess.IV (4896) eess.SY (3189) stat.ML (5346)
「cs.GT」カテゴリーアーカイブ
On Separation Between Best-Iterate, Random-Iterate, and Last-Iterate Convergence of Learning in Games
要約 ゲームにおける学習ダイナミクスの非エルゴディック収束は、理論と実践の両方に … 続きを読む
Last-Iterate Convergence Properties of Regret-Matching Algorithms in Games
要約 後悔の$^+$(rm $^+$)に基づいて、2プレイヤーゼロサムゲームを解 … 続きを読む
Anytime-Constrained Equilibria in Polynomial Time
要約 いつでも制約をマルコフゲームの設定と、いつでも制約のある平衡(ACE)の対 … 続きを読む
Iterative Nash Policy Optimization: Aligning LLMs with General Preferences via No-Regret Learning
要約 人間のフィードバックによる強化学習(RLHF)は、大規模な言語モデル(LL … 続きを読む
Re-evaluating Open-ended Evaluation of Large Language Models
要約 評価は、伝統的に特定のスキルの候補者のランキングに焦点を当ててきました。 … 続きを読む
Mixing Any Cocktail with Limited Ingredients: On the Structure of Payoff Sets in Multi-Objective MDPs and its Impact on Randomised Strategies
要約 マルコフの決定プロセスにおける多次元ペイオフ関数を検討し、特定の予想ペイオ … 続きを読む
Adversaries With Incentives: A Strategic Alternative to Adversarial Robustness
要約 敵対的な訓練は、 *敵対者 *を防御することを目的としています。その唯一の … 続きを読む
An Adversarial Analysis of Thompson Sampling for Full-information Online Learning: from Finite to Infinite Action Spaces
要約 専門家の空間ではなく、敵の将来の行動の空間で学習者の事前が定義されている場 … 続きを読む
An Adversarial Analysis of Thompson Sampling for Full-information Online Learning: from Finite to Infinite Action Spaces
要約 専門家の空間ではなく、敵の将来の行動の空間で学習者の事前が定義されている場 … 続きを読む
Human Misperception of Generative-AI Alignment: A Laboratory Experiment
要約 私たちは、経済的意思決定の文脈において、生成的人工知能(GENAI)のアラ … 続きを読む