cs.LG」カテゴリーアーカイブ

On Expressive Power of Looped Transformers: Theoretical Analysis and Enhancement via Timestep Encoding

要約 ループ化変換器は、推論タスクのパラメータ効率、計算能力、汎化性において優位 … 続きを読む

カテゴリー: cs.LG | On Expressive Power of Looped Transformers: Theoretical Analysis and Enhancement via Timestep Encoding はコメントを受け付けていません

Predicting the Price of Gold in the Financial Markets Using Hybrid Models

要約 最も誤差が少なく、最高の精度を提供できる価格を予測することは、資本市場の活 … 続きを読む

カテゴリー: cs.LG, econ.EM | Predicting the Price of Gold in the Financial Markets Using Hybrid Models はコメントを受け付けていません

How Effective are Large Time Series Models in Hydrology? A Study on Water Level Forecasting in Everglades

要約 エバーグレーズは、洪水や干ばつの調節、水資源計画、周辺地域の生態系管理にお … 続きを読む

カテゴリー: cs.LG | How Effective are Large Time Series Models in Hydrology? A Study on Water Level Forecasting in Everglades はコメントを受け付けていません

From Foresight to Forethought: VLM-In-the-Loop Policy Steering via Latent Alignment

要約 生成的なロボット・ポリシーは、デモンストレーションから複雑なマルチモーダル … 続きを読む

カテゴリー: cs.LG, cs.RO | From Foresight to Forethought: VLM-In-the-Loop Policy Steering via Latent Alignment はコメントを受け付けていません

Evaluating Frontier Models for Stealth and Situational Awareness

要約 最近の研究では、フロンティアAIのモデルが、開発者の意図とずれた目的を故意 … 続きを読む

カテゴリー: cs.LG | Evaluating Frontier Models for Stealth and Situational Awareness はコメントを受け付けていません

Negative Stepsizes Make Gradient-Descent-Ascent Converge

要約 最小-最大問題の効率的な計算は、最適化、学習、ゲーム、制御における中心的な … 続きを読む

カテゴリー: cs.DS, cs.LG, math.OC | Negative Stepsizes Make Gradient-Descent-Ascent Converge はコメントを受け付けていません

Computational, Data-Driven, and Physics-Informed Machine Learning Approaches for Microstructure Modeling in Metal Additive Manufacturing

要約 金属積層造形は、これまでにない設計の自由度と、カスタマイズされた複雑なコン … 続きを読む

カテゴリー: cs.LG | Computational, Data-Driven, and Physics-Informed Machine Learning Approaches for Microstructure Modeling in Metal Additive Manufacturing はコメントを受け付けていません

A Mathematical Philosophy of Explanations in Mechanistic Interpretability — The Strange Science Part I.i

要約 力学的解釈可能性は、因果的説明を通してニューラルネットワークを理解すること … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | A Mathematical Philosophy of Explanations in Mechanistic Interpretability — The Strange Science Part I.i はコメントを受け付けていません

CITER: Collaborative Inference for Efficient Large Language Model Decoding with Token-Level Routing

要約 大規模言語モデルは、様々なタスクにおいて目覚ましい成功を収めているが、推論 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.PF | CITER: Collaborative Inference for Efficient Large Language Model Decoding with Token-Level Routing はコメントを受け付けていません

Activation Steering in Neural Theorem Provers

要約 大規模言語モデル(LLM)は、Leanのような証明アシスタントを用いた形式 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Activation Steering in Neural Theorem Provers はコメントを受け付けていません