-
最近の投稿
- 3D Water Quality Mapping using Invariant Extended Kalman Filtering for Underwater Robot Localization
- Hybrid Visual Servoing of Tendon-driven Continuum Robots
- Embodying Control in Soft Multistable Grippers from morphofunctional co-design
- View-Invariant Policy Learning via Zero-Shot Novel View Synthesis
- ModSkill: Physical Character Skill Modularization
-
最近のコメント
表示できるコメントはありません。 cs.AI (34028) cs.CL (25726) cs.CR (2616) cs.CV (39965) cs.LG (39031) cs.RO (19850) cs.SY (3019) eess.IV (4757) eess.SY (3013) stat.ML (5150)
「stat.ML」カテゴリーアーカイブ
Towards Efficient Optimizer Design for LLM via Structured Fisher Approximation with a Low-Rank Extension
要約 低メモリの要件と速い収束を備えた大規模な言語モデル(LLMS)の効率的なオ … 続きを読む
Uncertainty quantification for Markov chains with application to temporal difference learning
要約 マルコフチェーンは、統計的な機械学習の基本であり、マルコフチェーンモンテカ … 続きを読む
Mixup Regularization: A Probabilistic Perspective
要約 近年、混合の正則化は、トレーニングデータの凸の組み合わせに関するトレーニン … 続きを読む
Faster WIND: Accelerating Iterative Best-of-$N$ Distillation for LLM Alignment
要約 大規模な言語モデルを人間の好みに合わせて最近の進歩は、ベスト・ア・ナス蒸留 … 続きを読む
The Computational Advantage of Depth: Learning High-Dimensional Hierarchical Functions with Gradient Descent
要約 浅いモデルと比較して勾配降下(GD)によって訓練された深いニューラルネット … 続きを読む
BNEM: A Boltzmann Sampler Based on Bootstrapped Noised Energy Matching
要約 ボルツマン分布から独立した同一分布(IID)サンプルを生成できる効率的なサ … 続きを読む
PoGDiff: Product-of-Gaussians Diffusion Models for Imbalanced Text-to-Image Generation
要約 拡散モデルは、近年大きな進歩を遂げています。 ただし、不均衡なデータセット … 続きを読む
Selective Reviews of Bandit Problems in AI via a Statistical View
要約 Rehnection Learning(RL)は、環境との相互作用を通じて … 続きを読む
ETGL-DDPG: A Deep Deterministic Policy Gradient Algorithm for Sparse Reward Continuous Control
要約 まばらな報酬を伴う強化学習の文脈において、深い決定論的政策勾配(DDPG) … 続きを読む