cs.LG」カテゴリーアーカイブ

Quartet: Native FP4 Training Can Be Optimal for Large Language Models

要約 大規模な言語モデル(LLMS)の急速な進歩は、計算需要の前例のない増加と並 … 続きを読む

カテゴリー: cs.LG | Quartet: Native FP4 Training Can Be Optimal for Large Language Models はコメントを受け付けていません

Quantum Optimization via Gradient-Based Hamiltonian Descent

要約 機械学習の急速な進歩により、計算効率と低メモリ要件により、最新の最適化技術 … 続きを読む

カテゴリー: cs.LG, math.OC, quant-ph | Quantum Optimization via Gradient-Based Hamiltonian Descent はコメントを受け付けていません

Internal Chain-of-Thought: Empirical Evidence for Layer-wise Subtask Scheduling in LLMs

要約 大規模な言語モデル(LLMS)が$ \ textIT {内部チェーンオブオ … 続きを読む

カテゴリー: cs.CL, cs.LG | Internal Chain-of-Thought: Empirical Evidence for Layer-wise Subtask Scheduling in LLMs はコメントを受け付けていません

Pivot Language for Low-Resource Machine Translation

要約 特定の言語のペアは、サイズが大きく、ドメインが多様な平行なコーパスの欠如に … 続きを読む

カテゴリー: 68T50, cs.CL, cs.LG, I.2.7 | Pivot Language for Low-Resource Machine Translation はコメントを受け付けていません

Enhancing Learned Knowledge in LoRA Adapters Through Efficient Contrastive Decoding on Ascend NPUs

要約 Huaweiクラウドユーザーは、アプリケーション固有のニーズに合わせて大規 … 続きを読む

カテゴリー: cs.CL, cs.LG | Enhancing Learned Knowledge in LoRA Adapters Through Efficient Contrastive Decoding on Ascend NPUs はコメントを受け付けていません

Energy-Efficient Deep Reinforcement Learning with Spiking Transformers

要約 エージェントベースのトランスは、複雑なタスクを解決する能力が実証されている … 続きを読む

カテゴリー: cs.AI, cs.LG | Energy-Efficient Deep Reinforcement Learning with Spiking Transformers はコメントを受け付けていません

Sinusoidal Initialization, Time for a New Start

要約 初期化は、深いニューラルネットワークトレーニングにおいて重要な役割を果たし … 続きを読む

カテゴリー: cs.AI, cs.LG, G.3 | Sinusoidal Initialization, Time for a New Start はコメントを受け付けていません

KORGym: A Dynamic Game Platform for LLM Reasoning Evaluation

要約 大規模な言語モデル(LLMS)の最近の進歩は、推論能力を正確に評価するため … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | KORGym: A Dynamic Game Platform for LLM Reasoning Evaluation はコメントを受け付けていません

Physics-Guided Learning of Meteorological Dynamics for Weather Downscaling and Forecasting

要約 気象予測は不可欠ですが、従来の数値気象予測(NWP)方法では計算集中的で物 … 続きを読む

カテゴリー: cs.AI, cs.LG | Physics-Guided Learning of Meteorological Dynamics for Weather Downscaling and Forecasting はコメントを受け付けていません

EquiBench: Benchmarking Large Language Models’ Understanding of Program Semantics via Equivalence Checking

要約 大規模な言語モデル(LLM)がコード関連のタスクに不可欠になると、中心的な … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.PL, cs.SE | EquiBench: Benchmarking Large Language Models’ Understanding of Program Semantics via Equivalence Checking はコメントを受け付けていません