cs.LG」カテゴリーアーカイブ

Synthesizing Diverse Network Flow Datasets with Scalable Dynamic Multigraph Generation

要約 プライバシー、セキュリティ、および計算上の制約のため、実際のネットワークデ … 続きを読む

カテゴリー: cs.LG, cs.NI | Synthesizing Diverse Network Flow Datasets with Scalable Dynamic Multigraph Generation はコメントを受け付けていません

MLE-Dojo: Interactive Environments for Empowering LLM Agents in Machine Learning Engineering

要約 Iterative Machine Learning Engineerin … 続きを読む

カテゴリー: cs.LG | MLE-Dojo: Interactive Environments for Empowering LLM Agents in Machine Learning Engineering はコメントを受け付けていません

Relative Overfitting and Accept-Reject Framework

要約 現在、大規模な言語モデル(LLMS)のスケーリング法則は、課題とボトルネッ … 続きを読む

カテゴリー: cs.LG | Relative Overfitting and Accept-Reject Framework はコメントを受け付けていません

Analytic theory of dropout regularization

要約 ドロップアウトは、過剰適合を緩和するために人工ニューラルネットワークのトレ … 続きを読む

カテゴリー: cond-mat.dis-nn, cond-mat.stat-mech, cs.LG, stat.ML | Analytic theory of dropout regularization はコメントを受け付けていません

A Theoretical Framework for Explaining Reinforcement Learning with Shapley Values

要約 強化学習エージェントは超人的なパフォーマンスを達成できますが、彼らの決定は … 続きを読む

カテゴリー: cs.LG | A Theoretical Framework for Explaining Reinforcement Learning with Shapley Values はコメントを受け付けていません

Automatically Differentiable Model Updating (ADiMU): conventional, hybrid, and neural network material model discovery including history-dependency

要約 フルフィールドの変位とグローバルな力データ(グローバル、間接発見)またはひ … 続きを読む

カテゴリー: cs.LG, cs.NA, math.NA, physics.comp-ph | Automatically Differentiable Model Updating (ADiMU): conventional, hybrid, and neural network material model discovery including history-dependency はコメントを受け付けていません

Understanding Stragglers in Large Model Training Using What-if Analysis

要約 大規模な言語モデル(LLM)トレーニングは、今日最も要求の厳しい分散計算の … 続きを読む

カテゴリー: cs.DC, cs.LG | Understanding Stragglers in Large Model Training Using What-if Analysis はコメントを受け付けていません

Semantic Retention and Extreme Compression in LLMs: Can We Have Both?

要約 大規模な言語モデル(LLM)の展開における指数関数的な成長により、計算コス … 続きを読む

カテゴリー: (Primary), 68T50, cs.AI, cs.CL, cs.LG, I.2.6 | Semantic Retention and Extreme Compression in LLMs: Can We Have Both? はコメントを受け付けていません

HREB-CRF: Hierarchical Reduced-bias EMA for Chinese Named Entity Recognition

要約 誤った境界区分、複雑な意味表現、および発音と意味の違いは、しばしば中国の名 … 続きを読む

カテゴリー: cs.CL, cs.LG | HREB-CRF: Hierarchical Reduced-bias EMA for Chinese Named Entity Recognition はコメントを受け付けていません

A Statistical Case Against Empirical Human-AI Alignment

要約 経験的な人間とaiの調整は、観察された人間の行動に沿ってAIシステムを行動 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, stat.OT | A Statistical Case Against Empirical Human-AI Alignment はコメントを受け付けていません