cs.LG」カテゴリーアーカイブ

DiffTORI: Differentiable Trajectory Optimization for Deep Reinforcement and Imitation Learning

要約 この論文では、微分可能軌道最適化をポリシー表現として利用して、深い強化学習 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | コメントする

iVideoGPT: Interactive VideoGPTs are Scalable World Models

要約 ワールド モデルにより、モデルベースのエージェントは、現実世界の意思決定の … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | コメントする

Local Linearity: the Key for No-regret Reinforcement Learning in Continuous MDPs

要約 連続状態およびアクション空間環境における強化学習 (RL) 問題のノーリグ … 続きを読む

カテゴリー: cs.LG | コメントする

Univariate Conditional Variational Autoencoder for Morphogenic Patterns Design in Frontal Polymerization-Based Manufacturing

要約 一部の初期条件および境界条件下では、正面重合 (FP) 中に起こる急速な反 … 続きを読む

カテゴリー: cs.LG, physics.comp-ph | コメントする

Efficient Federated Learning against Heterogeneous and Non-stationary Client Unavailability

要約 断続的なクライアント可用性への対処は、フェデレーテッド ラーニング アルゴ … 続きを読む

カテゴリー: cs.DC, cs.LG, math.OC | コメントする

Hamiltonian Monte Carlo Inference of Marginalized Linear Mixed-Effects Models

要約 線形混合効果モデル (LMM) でのベイズ推論は困難であり、多くの場合、マ … 続きを読む

カテゴリー: cs.LG, stat.ML | コメントする

Demystifying Linear MDPs and Novel Dynamics Aggregation Framework

要約 この研究では、線形 MDP では、遷移確率を適切に表すために、特徴次元 $ … 続きを読む

カテゴリー: cs.LG, stat.ML | コメントする

Progressive Safeguards for Safe and Model-Agnostic Reinforcement Learning

要約 この論文では、安全な強化学習のための正式なモデルに依存しないメタ学習フレー … 続きを読む

カテゴリー: cs.LG, cs.LO | コメントする

Offline Multitask Representation Learning for Reinforcement Learning

要約 私たちは、強化学習 (RL) におけるオフライン マルチタスク表現学習を研 … 続きを読む

カテゴリー: cs.LG | コメントする

Benchmark Data Repositories for Better Benchmarking

要約 機械学習の研究では、標準ベンチマーク データセットでのパフォーマンスを通じ … 続きを読む

カテゴリー: cs.DL, cs.LG | コメントする