stat.ML」カテゴリーアーカイブ

Towards Efficient Optimizer Design for LLM via Structured Fisher Approximation with a Low-Rank Extension

要約 低メモリの要件と速い収束を備えた大規模な言語モデル(LLMS)の効率的なオ … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | コメントする

Uncertainty quantification for Markov chains with application to temporal difference learning

要約 マルコフチェーンは、統計的な機械学習の基本であり、マルコフチェーンモンテカ … 続きを読む

カテゴリー: cs.LG, stat.ML | コメントする

Mixup Regularization: A Probabilistic Perspective

要約 近年、混合の正則化は、トレーニングデータの凸の組み合わせに関するトレーニン … 続きを読む

カテゴリー: cs.LG, stat.ML | コメントする

Faster WIND: Accelerating Iterative Best-of-$N$ Distillation for LLM Alignment

要約 大規模な言語モデルを人間の好みに合わせて最近の進歩は、ベスト・ア・ナス蒸留 … 続きを読む

カテゴリー: cs.LG, stat.ML | コメントする

The Computational Advantage of Depth: Learning High-Dimensional Hierarchical Functions with Gradient Descent

要約 浅いモデルと比較して勾配降下(GD)によって訓練された深いニューラルネット … 続きを読む

カテゴリー: cs.LG, stat.ML | コメントする

BNEM: A Boltzmann Sampler Based on Bootstrapped Noised Energy Matching

要約 ボルツマン分布から独立した同一分布(IID)サンプルを生成できる効率的なサ … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.CO, stat.ML | コメントする

PoGDiff: Product-of-Gaussians Diffusion Models for Imbalanced Text-to-Image Generation

要約 拡散モデルは、近年大きな進歩を遂げています。 ただし、不均衡なデータセット … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ML | コメントする

Selective Reviews of Bandit Problems in AI via a Statistical View

要約 Rehnection Learning(RL)は、環境との相互作用を通じて … 続きを読む

カテゴリー: cs.AI, cs.LG, econ.EM, math.PR, stat.ML | コメントする

ETGL-DDPG: A Deep Deterministic Policy Gradient Algorithm for Sparse Reward Continuous Control

要約 まばらな報酬を伴う強化学習の文脈において、深い決定論的政策勾配(DDPG) … 続きを読む

カテゴリー: cs.LG, cs.RO, stat.ML | コメントする

Asymptotic Optimism of Random-Design Linear and Kernel Regression Models

要約 私たちは、ランダム設計下で線形回帰モデルの閉じた漸近楽観主義を導き出し、そ … 続きを読む

カテゴリー: 68Q32, 68T05, cs.LG, math.ST, stat.ML, stat.TH | コメントする