cs.LG」カテゴリーアーカイブ

Robust Gymnasium: A Unified Modular Benchmark for Robust Reinforcement Learning

要約 固有の不確実性とSIMからリアルのギャップによって駆動される堅牢な強化学習 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | コメントする

ServoLNN: Lagrangian Neural Networks Driven by Servomechanisms

要約 深い学習と古典的な物理学を組み合わせることで、正確な動的モデルの効率的な作 … 続きを読む

カテゴリー: cs.LG, cs.RO, I.2.9, math.DS | コメントする

Student-Informed Teacher Training

要約 特権教師による模倣学習は、画像などの高次元入力から複雑な制御行動を学習する … 続きを読む

カテゴリー: cs.LG, cs.RO | コメントする

RIZE: Regularized Imitation Learning via Distributional Reinforcement Learning

要約 固定報酬の割り当ての制限と暗黙の報酬の正則化における制約のある柔軟性を克服 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | コメントする

Discovering Antagonists in Networks of Systems: Robot Deployment

要約 文脈上の異常検出方法が提案され、カバレッジタスクを実行するロボット群れの物 … 続きを読む

カテゴリー: cs.LG, cs.MA, cs.RO, G.3 | コメントする

Accelerating Model-Based Reinforcement Learning with State-Space World Models

要約 強化学習(RL)は、ロボット学習の強力なアプローチです。 ただし、モデルフ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.NE, cs.RO, I.2.10, stat.ML | コメントする

ReMoE: Fully Differentiable Mixture-of-Experts with ReLU Routing

要約 まばらに活性化された混合混合物(MOE)モデルは、計算予算を増やすことなく … 続きを読む

カテゴリー: cs.LG | コメントする

Formation of Representations in Neural Networks

要約 神経表現を理解することは、ニューラルネットワークのブラックボックスを開き、 … 続きを読む

カテゴリー: cond-mat.dis-nn, cs.LG | コメントする

Random Latent Exploration for Deep Reinforcement Learning

要約 強化学習(RL)におけるシンプルで効果的な探索戦略であるランダム潜在探査( … 続きを読む

カテゴリー: cs.LG | コメントする

Understanding the Limits of Deep Tabular Methods with Temporal Shift

要約 深い層のモデルは、I.I.D。で顕著な成功を示しています。 さまざまな構造 … 続きを読む

カテゴリー: 68T05, cs.LG, I.2.6 | コメントする