-
最近の投稿
- Towards Multi-agent Reinforcement Learning based Traffic Signal Control through Spatio-temporal Hypergraphs
- Deep learning for music generation. Four approaches and their comparative evaluation
- Knowledge Graph Completion with Mixed Geometry Tensor Factorization
- Iterated $Q$-Network: Beyond One-Step Bellman Updates in Deep Reinforcement Learning
- Multi-SWE-bench: A Multilingual Benchmark for Issue Resolving
-
最近のコメント
表示できるコメントはありません。 cs.AI (36099) cs.CL (27286) cs.CR (2747) cs.CV (41948) cs.LG (41052) cs.RO (21304) cs.SY (3219) eess.IV (4920) eess.SY (3213) stat.ML (5378)
「65Y20」カテゴリーアーカイブ
Analysis of an Idealized Stochastic Polyak Method and its Application to Black-Box Model Distillation
要約 SPS $^*$と呼ばれる理想的な確率的ポリックステップサイズの一般的な収 … 続きを読む
$ε$-Policy Gradient for Online Pricing
要約 本稿では、モデルベースとモデルフリーの強化学習アプローチを組み合わせて、オ … 続きを読む
A Note on Randomized Kaczmarz Algorithm for Solving Doubly-Noisy Linear Systems
要約 大規模な線形システム $Ax=b$ は実際に頻繁に発生し、効果的な反復ソル … 続きを読む
MoMo: Momentum Models for Adaptive Learning Rates
要約 我々は、どのような運動量法でも使用できる新しい適応的な学習率を提示する。こ … 続きを読む
Multilevel Objective-Function-Free Optimization with an Application to Neural Networks Training
要約 目的関数の評価を必要としない、制約のない非線形最適化のためのマルチレベル … 続きを読む