月別アーカイブ: 2024年2月

Arbitrary Polynomial Separations in Trainable Quantum Machine Learning

投稿日: 2024年2月14日作成者: jarxiv

要約量子機械学習における最近の理論的結果は、量子ニューラルネットワーク (Q … 続きを読む →

カテゴリー: cs.LG, quant-ph | コメントを受け付けていません

Neural Algorithmic Reasoning for Combinatorial Optimisation

投稿日: 2024年2月14日作成者: jarxiv

要約ニューラルネットワークを使用して NP 困難/完全な組み合わせ問題を解決 … 続きを読む →

カテゴリー: cs.LG, cs.NE | コメントを受け付けていません

A Novel Framework for Policy Mirror Descent with General Parameterization and Linear Convergence

投稿日: 2024年2月14日作成者: jarxiv

要約 TRPO や PPO などの強化学習における最新のポリシー最適化手法の成功 … 続きを読む →

カテゴリー: cs.LG, math.OC, math.ST, stat.ML, stat.TH | コメントを受け付けていません

Beyond Lengthscales: No-regret Bayesian Optimisation With Unknown Hyperparameters Of Any Type

投稿日: 2024年2月14日作成者: jarxiv

要約ベイジアン最適化にはガウス過程モデルのフィッティングが必要であり、そのため … 続きを読む →

カテゴリー: cs.LG, stat.ML | コメントを受け付けていません

Learning to Stabilize Online Reinforcement Learning in Unbounded State Spaces

投稿日: 2024年2月14日作成者: jarxiv

要約多くの強化学習 (RL) アプリケーションでは、望ましい状態に到達し、制御 … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

Adjustment Identification Distance: A gadjid for Causal Structure Learning

投稿日: 2024年2月14日作成者: jarxiv

要約因果関係発見アルゴリズムによって学習されたグラフの評価は困難です。2 つの … 続きを読む →

カテゴリー: cs.LG, stat.ME, stat.ML | コメントを受け付けていません

A Generalized Approach to Online Convex Optimization

投稿日: 2024年2月14日作成者: jarxiv

要約この論文では、さまざまな設定におけるオンライン凸最適化の問題を分析します。 … 続きを読む →

カテゴリー: cs.LG, math.OC, stat.ML | コメントを受け付けていません

Strategizing against No-Regret Learners in First-Price Auctions

投稿日: 2024年2月14日作成者: jarxiv

要約私たちは、2 人のプレイヤーの間で繰り返されるファーストプライスオークシ … 続きを読む →

カテゴリー: cs.DS, cs.GT, cs.LG | コメントを受け付けていません

Learning Emergent Gaits with Decentralized Phase Oscillators: on the role of Observations, Rewards, and Feedback

投稿日: 2024年2月14日作成者: jarxiv

要約四足歩行を学習するための最小位相振動子モデルを紹介します。 4 つの振動子 … 続きを読む →

カテゴリー: cs.LG, cs.RO | コメントを受け付けていません

Target Score Matching

投稿日: 2024年2月14日作成者: jarxiv

要約ノイズ除去スコアマッチングは、回帰損失を最小限に抑えることで、ターゲット … 続きを読む →

カテゴリー: cs.LG, stat.CO, stat.ML | コメントを受け付けていません

月別アーカイブ: 2024年2月

Arbitrary Polynomial Separations in Trainable Quantum Machine Learning

Neural Algorithmic Reasoning for Combinatorial Optimisation

A Novel Framework for Policy Mirror Descent with General Parameterization and Linear Convergence

Beyond Lengthscales: No-regret Bayesian Optimisation With Unknown Hyperparameters Of Any Type

Learning to Stabilize Online Reinforcement Learning in Unbounded State Spaces

Adjustment Identification Distance: A gadjid for Causal Structure Learning

A Generalized Approach to Online Convex Optimization

Strategizing against No-Regret Learners in First-Price Auctions

Learning Emergent Gaits with Decentralized Phase Oscillators: on the role of Observations, Rewards, and Feedback

Target Score Matching

最近の投稿

最近のコメント

アーカイブ

カテゴリー