-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.GT」カテゴリーアーカイブ
Social Choice Should Guide AI Alignment in Dealing with Diverse Human Feedback
要約 GPT-4 などの財団モデルは、犯罪の幇助や人種差別的なテキストの作成など … 続きを読む
The complexity of approximate (coarse) correlated equilibrium for incomplete information games
要約 不完全情報ゲームにおける近似相関平衡の分散学習の反復の複雑さを研究します。 … 続きを読む
Pontryagin Neural Operator for Solving Parametric General-Sum Differential Games
要約 二人対戦の一般和微分ゲームの値は、ハミルトン-ヤコビ-アイザック(HJI) … 続きを読む
Model-Based RL for Mean-Field Games is not Statistically Harder than Single-Agent RL
要約 本研究では、モデルベースの関数近似を用いた平均場ゲーム(MFG)における強 … 続きを読む
Fusion-PSRO: Nash Policy Fusion for Policy Space Response Oracles
要約 ゼロサムゲームを解くための一般的なアプローチは、ナッシュ均衡(NE)を近似 … 続きを読む
Stochastic Online Fisher Markets: Static Pricing Limits and Adaptive Enhancements
要約 漁場は資源配分の最も基本的なモデルの 1 つです。 しかし、フィッシャーマ … 続きを読む
Fusion-PSRO: Nash Policy Fusion for Policy Space Response Oracles
要約 非推移性を伴うゼロサム ゲームを解決するための一般的なアプローチは、ナッシ … 続きを読む
Eliciting Informative Text Evaluations with Large Language Models
要約 ピア予測メカニズムは、証明可能な保証を備えた高品質のフィードバックを動機付 … 続きを読む
Policy Space Response Oracles: A Survey
要約 ゲーム理論は、複数の意思決定者間の相互作用を研究する数学的方法を提供します … 続きを読む
Axioms for AI Alignment from Human Feedback
要約 ヒューマン フィードバックからの強化学習 (RLHF) のコンテキストでは … 続きを読む