月別アーカイブ: 2024年2月

Arbitrary Polynomial Separations in Trainable Quantum Machine Learning

要約 量子機械学習における最近の理論的結果は、量子ニューラル ネットワーク (Q … 続きを読む

カテゴリー: cs.LG, quant-ph | Arbitrary Polynomial Separations in Trainable Quantum Machine Learning はコメントを受け付けていません

Neural Algorithmic Reasoning for Combinatorial Optimisation

要約 ニューラル ネットワークを使用して NP 困難/完全な組み合わせ問題を解決 … 続きを読む

カテゴリー: cs.LG, cs.NE | Neural Algorithmic Reasoning for Combinatorial Optimisation はコメントを受け付けていません

A Novel Framework for Policy Mirror Descent with General Parameterization and Linear Convergence

要約 TRPO や PPO などの強化学習における最新のポリシー最適化手法の成功 … 続きを読む

カテゴリー: cs.LG, math.OC, math.ST, stat.ML, stat.TH | A Novel Framework for Policy Mirror Descent with General Parameterization and Linear Convergence はコメントを受け付けていません

Beyond Lengthscales: No-regret Bayesian Optimisation With Unknown Hyperparameters Of Any Type

要約 ベイジアン最適化にはガウス過程モデルのフィッティングが必要であり、そのため … 続きを読む

カテゴリー: cs.LG, stat.ML | Beyond Lengthscales: No-regret Bayesian Optimisation With Unknown Hyperparameters Of Any Type はコメントを受け付けていません

Learning to Stabilize Online Reinforcement Learning in Unbounded State Spaces

要約 多くの強化学習 (RL) アプリケーションでは、望ましい状態に到達し、制御 … 続きを読む

カテゴリー: cs.LG | Learning to Stabilize Online Reinforcement Learning in Unbounded State Spaces はコメントを受け付けていません

Adjustment Identification Distance: A gadjid for Causal Structure Learning

要約 因果関係発見アルゴリズムによって学習されたグラフの評価は困難です。2 つの … 続きを読む

カテゴリー: cs.LG, stat.ME, stat.ML | Adjustment Identification Distance: A gadjid for Causal Structure Learning はコメントを受け付けていません

A Generalized Approach to Online Convex Optimization

要約 この論文では、さまざまな設定におけるオンライン凸最適化の問題を分析します。 … 続きを読む

カテゴリー: cs.LG, math.OC, stat.ML | A Generalized Approach to Online Convex Optimization はコメントを受け付けていません

Strategizing against No-Regret Learners in First-Price Auctions

要約 私たちは、2 人のプレイヤーの間で繰り返されるファーストプライス オークシ … 続きを読む

カテゴリー: cs.DS, cs.GT, cs.LG | Strategizing against No-Regret Learners in First-Price Auctions はコメントを受け付けていません

Learning Emergent Gaits with Decentralized Phase Oscillators: on the role of Observations, Rewards, and Feedback

要約 四足歩行を学習するための最小位相振動子モデルを紹介します。 4 つの振動子 … 続きを読む

カテゴリー: cs.LG, cs.RO | Learning Emergent Gaits with Decentralized Phase Oscillators: on the role of Observations, Rewards, and Feedback はコメントを受け付けていません

Target Score Matching

要約 ノイズ除去スコア マッチングは、回帰損失を最小限に抑えることで、ターゲット … 続きを読む

カテゴリー: cs.LG, stat.CO, stat.ML | Target Score Matching はコメントを受け付けていません