stat.ML」カテゴリーアーカイブ

Hard-Constrained Neural Networks with Universal Approximation Guarantees

要約 入出力関係の事前知識や仕様を機械学習モデルに組み込むことは、限られたデータ … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | コメントする

Stabilizing Temporal Difference Learning via Implicit Stochastic Approximation

要約 時間差(TD)学習は、強化学習(RL)における基礎的なアルゴリズムである。 … 続きを読む

カテゴリー: cs.LG, math.PR, stat.ML | コメントする

Provable Efficiency of Guidance in Diffusion Models for General Data Distribution

要約 拡散モデルは生成モデリングの強力なフレームワークとして登場し、ガイダンス技 … 続きを読む

カテゴリー: cs.LG, math.ST, stat.ML, stat.TH | コメントする

How Transformers Learn Regular Language Recognition: A Theoretical Study on Training Dynamics and Implicit Bias

要約 言語認識タスクは自然言語処理(NLP)の基本であり、大規模言語モデル(LL … 続きを読む

カテゴリー: cs.CL, cs.LG, stat.ML | コメントする

Dynamics of Spontaneous Topic Changes in Next Token Prediction with Self-Attention

要約 人間の認知は、感情的、文脈的、または連想的な手がかりによって引き起こされる … 続きを読む

カテゴリー: cs.AI, cs.CL, stat.ML | コメントする

MoDeGPT: Modular Decomposition for Large Language Model Compression

要約 大規模言語モデル(LLM)は、様々なタスクにおいて卓越した性能を発揮するこ … 続きを読む

カテゴリー: (Primary), cs.CL, cs.LG, I.2.7, stat.ML | コメントする

Fast and Robust: Task Sampling with Posterior and Diversity Synergies for Adaptive Decision-Makers in Randomized Environments

要約 タスクに頑健な適応は、逐次的な意思決定における長年の課題である。いくつかの … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | コメントする

Risk Analysis and Design Against Adversarial Actions

要約 敵対的な行動に直面しても信頼できる予測を提供できるモデルを学習することは、 … 続きを読む

カテゴリー: cs.AI, cs.LG, math.ST, stat.ML, stat.TH | コメントする

A Causal World Model Underlying Next Token Prediction: Exploring GPT in a Controlled Environment

要約 次のトークンを予測するためだけに訓練された生成的事前訓練変換器(GPT)モ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, stat.ML | コメントする

Towards One Model for Classical Dimensionality Reduction: A Probabilistic Perspective on UMAP and t-SNE

要約 この論文では、UMAPやt-SNEなどの次元削減手法が、Ravuriら(2 … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | コメントする