-
最近の投稿
- Exploring Modular Mobility: Industry Advancements, Research Trends, and Future Directions on Modular Autonomous Vehicles
- Causal Composition Diffusion Model for Closed-loop Traffic Generation
- DRAL: Deep Reinforcement Adaptive Learning for Multi-UAVs Navigation in Unknown Indoor Environment
- Asynchronous Training of Mixed-Role Human Actors in a Partially-Observable Environment
- LMV-RPA: Large Model Voting-based Robotic Process Automation
-
最近のコメント
表示できるコメントはありません。 cs.AI (31450) cs.CL (23788) cs.CR (2442) cs.CV (37795) cs.LG (36318) cs.RO (18381) cs.SY (2817) eess.IV (4541) eess.SY (2811) stat.ML (4821)
「stat.ML」カテゴリーアーカイブ
Merging versus Ensembling in Multi-Study Prediction: Theoretical Insight from Random Effects
要約 複数の研究を使用して予測変数をトレーニングする場合の重要な決定点は、研究を … 続きを読む
Score and Distribution Matching Policy: Advanced Accelerated Visuomotor Policies via Matched Distillation
要約 視覚運動ポリシーの学習は、複雑なロボットの軌道をモデル化することで知られる … 続きを読む
Bayesian Optimization via Continual Variational Last Layer Training
要約 ガウス過程 (GP) は、不確実性をモデル化する能力と、相関関係が容易に把 … 続きを読む
Nearly Minimax Optimal Submodular Maximization with Bandit Feedback
要約 未知の単調な部分モジュラー集合関数 $f: 2^{[n]} \righta … 続きを読む
Capturing the Temporal Dependence of Training Data Influence
要約 影響関数などの従来のデータ影響推定手法では、学習アルゴリズムがトレーニング … 続きを読む
Enhancing Convergence of Decentralized Gradient Tracking under the KL Property
要約 私たちは、無向グラフとしてモデル化された、ネットワーク上の分散型マルチエー … 続きを読む
Wait-Less Offline Tuning and Re-solving for Online Decision Making
要約 オンライン線形計画法 (OLP) は、収益管理とリソース割り当てに幅広い用 … 続きを読む
Model Developmental Safety: A Retention-Centric Method and Applications in Vision-Language Models
要約 現実の世界では、学習対応システムは通常、困難なタスクや新たなタスクを処理す … 続きを読む
Sail into the Headwind: Alignment via Robust Rewards and Dynamic Labels against Reward Hacking
要約 AI システムを人間の好みに合わせると、不完全な報酬モデルの最適化が望まし … 続きを読む