cs.LG」カテゴリーアーカイブ

Discovering Antagonists in Networks of Systems: Robot Deployment

要約 文脈上の異常検出方法が提案され、カバレッジタスクを実行するロボット群れの物 … 続きを読む

カテゴリー: cs.LG, cs.MA, cs.RO, G.3 | Discovering Antagonists in Networks of Systems: Robot Deployment はコメントを受け付けていません

Accelerating Model-Based Reinforcement Learning with State-Space World Models

要約 強化学習(RL)は、ロボット学習の強力なアプローチです。 ただし、モデルフ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.NE, cs.RO, I.2.10, stat.ML | Accelerating Model-Based Reinforcement Learning with State-Space World Models はコメントを受け付けていません

ReMoE: Fully Differentiable Mixture-of-Experts with ReLU Routing

要約 まばらに活性化された混合混合物(MOE)モデルは、計算予算を増やすことなく … 続きを読む

カテゴリー: cs.LG | ReMoE: Fully Differentiable Mixture-of-Experts with ReLU Routing はコメントを受け付けていません

Formation of Representations in Neural Networks

要約 神経表現を理解することは、ニューラルネットワークのブラックボックスを開き、 … 続きを読む

カテゴリー: cond-mat.dis-nn, cs.LG | Formation of Representations in Neural Networks はコメントを受け付けていません

Random Latent Exploration for Deep Reinforcement Learning

要約 強化学習(RL)におけるシンプルで効果的な探索戦略であるランダム潜在探査( … 続きを読む

カテゴリー: cs.LG | Random Latent Exploration for Deep Reinforcement Learning はコメントを受け付けていません

Understanding the Limits of Deep Tabular Methods with Temporal Shift

要約 深い層のモデルは、I.I.D。で顕著な成功を示しています。 さまざまな構造 … 続きを読む

カテゴリー: 68T05, cs.LG, I.2.6 | Understanding the Limits of Deep Tabular Methods with Temporal Shift はコメントを受け付けていません

On the Importance of Reward Design in Reinforcement Learning-based Dynamic Algorithm Configuration: A Case Study on OneMax with (1+($λ$,$λ$))-GA

要約 動的アルゴリズム構成(DAC)は、特に機械学習と深い学習アルゴリズムの有病 … 続きを読む

カテゴリー: cs.LG, cs.NE | On the Importance of Reward Design in Reinforcement Learning-based Dynamic Algorithm Configuration: A Case Study on OneMax with (1+($λ$,$λ$))-GA はコメントを受け付けていません

A Counterfactual Analysis of the Dishonest Casino

要約 不正なカジノは、HMMSとグラフィカルモデルを導入するために教育環境で使用 … 続きを読む

カテゴリー: cs.LG | A Counterfactual Analysis of the Dishonest Casino はコメントを受け付けていません

Online Meta-learning for AutoML in Real-time (OnMAR)

要約 Automated Machine Learning(Automl)は、最 … 続きを読む

カテゴリー: cs.LG | Online Meta-learning for AutoML in Real-time (OnMAR) はコメントを受け付けていません

Mitigating the Backdoor Effect for Multi-Task Model Merging via Safety-Aware Subspace

要約 モデルのマージは、複数のシングルタスクの微調整されたモデルを統合されたモデ … 続きを読む

カテゴリー: cs.CR, cs.LG | Mitigating the Backdoor Effect for Multi-Task Model Merging via Safety-Aware Subspace はコメントを受け付けていません