-
最近の投稿
- Crossing the Reward Bridge: Expanding RL with Verifiable Rewards Across Diverse Domains
- TeleAntiFraud-28k: An Audio-Text Slow-Thinking Dataset for Telecom Fraud Detection
- A Comparative Study of Scanpath Models in Graph-Based Visualization
- Image as an IMU: Estimating Camera Motion from a Single Motion-Blurred Image
- Self-Supervised Pretraining for Aerial Road Extraction
-
最近のコメント
表示できるコメントはありません。 cs.AI (35923) cs.CL (27170) cs.CR (2738) cs.CV (41778) cs.LG (40884) cs.RO (21198) cs.SY (3205) eess.IV (4905) eess.SY (3199) stat.ML (5358)
「91A05」カテゴリーアーカイブ
Paying to Do Better: Games with Payments between Learning Agents
要約 オークションなどの繰り返しのゲームでは、プレイヤーは通常、学習アルゴリズム … 続きを読む
Computing Game Symmetries and Equilibria That Respect Them
要約 マルチエージェント システム内の対称性を認識していれば、戦略的相互作用をよ … 続きを読む
Convergence analysis and acceleration of the smoothing methods for solving extensive-form games
要約 拡張形式のゲームは、近年かなり研究されています。 複数の決定ポイントと不完 … 続きを読む