-
最近の投稿
- Generalizing Safety Beyond Collision-Avoidance via Latent-Space Reachability Analysis
- AI-Enhanced Automatic Design of Efficient Underwater Gliders
- Safe Navigation in Dynamic Environments Using Data-Driven Koopman Operators and Conformal Prediction
- Future-Oriented Navigation: Dynamic Obstacle Avoidance with One-Shot Energy-Based Multimodal Motion Prediction
- Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (37465) cs.CL (28340) cs.CV (43135) cs.HC (2865) cs.LG (42385) cs.RO (22230) cs.SY (3405) eess.IV (5014) eess.SY (3397) stat.ML (5531)
「cs.LG」カテゴリーアーカイブ
A Dual Perspective of Reinforcement Learning for Imposing Policy Constraints
要約 モデルフリーの強化学習方法には、訓練されたポリシーに行動の制約を課す固有の … 続きを読む
AMAD: AutoMasked Attention for Unsupervised Multivariate Time Series Anomaly Detection
要約 監視されていない多変量時系列異常検出(UMTSAD)は、金融、ネットワーク … 続きを読む
Kimi-Audio Technical Report
要約 オーディオの理解、生成、会話に優れたオープンソースオーディオファンデーショ … 続きを読む
Enhancing Pre-Trained Model-Based Class-Incremental Learning through Neural Collapse
要約 クラスインクリメンタル学習(CIL)は、実際のアプリケーションにとって重要 … 続きを読む
MeTHanol: Modularized Thinking Language Models with Intermediate Layer Thinking, Decoding and Bootstrapping Reasoning
要約 大規模な言語モデルは、人間の表現を合理的に理解し、生成することができますが … 続きを読む
A Picture is Worth A Thousand Numbers: Enabling LLMs Reason about Time Series via Visualization
要約 複数のドメインにわたって実証された推論能力を備えた大規模な言語モデル(LL … 続きを読む
Reinforcement Learning-based Threat Assessment
要約 一部のゲームシナリオでは、敵ユニットの数の不確実性とさまざまな属性の優先順 … 続きを読む
Bidirectional Decoding: Improving Action Chunking via Guided Test-Time Sampling
要約 アクションチャンキングとして知られる中間の再生なしで一連のアクションを予測 … 続きを読む
Scaling Laws For Scalable Oversight
要約 スケーラブルな監視、より弱いAIシステムがより強力なシステムを監督するプロ … 続きを読む