-
最近の投稿
- Enhancing Efficiency in Multidevice Federated Learning through Data Selection
- RadarTrack: Enhancing Ego-Vehicle Speed Estimation with Single-chip mmWave Radar
- HOPE: A Reinforcement Learning-based Hybrid Policy Path Planner for Diverse Parking Scenarios
- From Imitation to Exploration: End-to-end Autonomous Driving based on World Model
- LLM-Enabled In-Context Learning for Data Collection Scheduling in UAV-assisted Sensor Networks
-
最近のコメント
表示できるコメントはありません。 cs.AI (36903) cs.CL (27936) cs.CV (42678) cs.HC (2822) cs.LG (41843) cs.RO (21845) cs.SY (3324) eess.IV (4979) eess.SY (3316) stat.ML (5475)
「cs.GT」カテゴリーアーカイブ
AlphaDou: High-Performance End-to-End Doudizhu AI Integrating Bidding
要約 カード ゲーム用の人工知能は、AI 研究において長い間人気のトピックでした … 続きを読む
Policy Optimization finds Nash Equilibrium in Regularized General-Sum LQ Games
要約 この論文では、General-Sum $N$-agent ゲームのナッシュ … 続きを読む
Multi-Robot Coordination Induced in Hazardous Environments through an Adversarial Graph-Traversal Game
要約 この論文では、軍事およびセキュリティ用途など、敵が存在する危険な環境を移動 … 続きを読む
Rethinking Teacher-Student Curriculum Learning through the Cooperative Mechanics of Experience
要約 Teacher-Student Curriculum Learning ( … 続きを読む
Cyber Deception: State of the art, Trends and Open challenges
要約 サイバーセキュリティへの関心の高まりにより、さまざまなサイバー デセプショ … 続きを読む
Indirect Dynamic Negotiation in the Nash Demand Game
要約 この論文は、不完全な情報による逐次二国間交渉の問題を扱っています。 私たち … 続きを読む
Partially Observable Multi-Agent Reinforcement Learning with Information Sharing
要約 私たちは、部分的に観測可能な確率的ゲーム (POSG) の一般的な枠組みで … 続きを読む
Multi-Agent Reinforcement Learning from Human Feedback: Data Coverage and Algorithmic Techniques
要約 私たちは、ヒューマン フィードバックからのマルチエージェント強化学習 (M … 続きを読む
Eliciting Informative Text Evaluations with Large Language Models
要約 ピア予測メカニズムは、証明可能な保証を持つ高品質のフィードバックを動機づけ … 続きを読む