投稿者「jarxiv」のアーカイブ

Beyond the Neural Fog: Interpretable Learning for AC Optimal Power Flow

要約 AC Optimal Power Flow(AC-OPF)の問題は、電力シ … 続きを読む

カテゴリー: cs.LG, cs.SY, eess.SY, math.OC | Beyond the Neural Fog: Interpretable Learning for AC Optimal Power Flow はコメントを受け付けていません

Training Dynamics of In-Context Learning in Linear Attention

要約 注意ベースのモデルはコンテキスト内学習の顕著な能力を実証していますが、これ … 続きを読む

カテゴリー: cs.LG | Training Dynamics of In-Context Learning in Linear Attention はコメントを受け付けていません

Towards Physically Interpretable World Models: Meaningful Weakly Supervised Representations for Visual Trajectory Prediction

要約 深い学習モデルは、複雑なシステムでの知覚、予測、および制御のためにますます … 続きを読む

カテゴリー: cs.LG | Towards Physically Interpretable World Models: Meaningful Weakly Supervised Representations for Visual Trajectory Prediction はコメントを受け付けていません

Towards understanding the bias in decision trees

要約 不均衡なデータから学習する際には、機械学習モデルが多数派(またはネガティブ … 続きを読む

カテゴリー: cs.LG, stat.ML | Towards understanding the bias in decision trees はコメントを受け付けていません

CENTS: Generating synthetic electricity consumption time series for rare and unseen scenarios

要約 大規模生成モデリングの最近のブレークスルーは、自然言語、コンピュータービジ … 続きを読む

カテゴリー: cs.LG | CENTS: Generating synthetic electricity consumption time series for rare and unseen scenarios はコメントを受け付けていません

Two-Timescale Gradient Descent Ascent Algorithms for Nonconvex Minimax Optimization

要約 $ \ min_ \ textbf {x} \ max _ {\ text … 続きを読む

カテゴリー: cs.LG, math.OC | Two-Timescale Gradient Descent Ascent Algorithms for Nonconvex Minimax Optimization はコメントを受け付けていません

Graph Neural Network Based Hybrid Beamforming Design in Wideband Terahertz MIMO-OFDM Systems

要約 6Gワイヤレステクノロジーは、高度に方向性のあるビームフォーミングによって … 続きを読む

カテゴリー: cs.LG, cs.NI, eess.SP | Graph Neural Network Based Hybrid Beamforming Design in Wideband Terahertz MIMO-OFDM Systems はコメントを受け付けていません

Implicit Bias in Matrix Factorization and its Explicit Realization in a New Architecture

要約 マトリックス因数分解の勾配降下は、ほぼ低いランクのソリューションに対して暗 … 続きを読む

カテゴリー: cs.LG, math.OC, stat.ML | Implicit Bias in Matrix Factorization and its Explicit Realization in a New Architecture はコメントを受け付けていません

Tailored Forecasting from Short Time Series via Meta-learning

要約 機械学習(ML)モデルは、時シリーズデータから未知のシステムのダイナミクス … 続きを読む

カテゴリー: cs.LG, nlin.CD, physics.comp-ph | Tailored Forecasting from Short Time Series via Meta-learning はコメントを受け付けていません

Towards Cross-Tokenizer Distillation: the Universal Logit Distillation Loss for LLMs

要約 コスト、待ち時間の制限、ハードウェアのアクセシビリティなどの制約により、ほ … 続きを読む

カテゴリー: cs.CL | Towards Cross-Tokenizer Distillation: the Universal Logit Distillation Loss for LLMs はコメントを受け付けていません