「cs.LG」カテゴリーアーカイブ

Quartet: Native FP4 Training Can Be Optimal for Large Language Models

投稿日: 2025年5月21日作成者: jarxiv

要約大規模な言語モデル（LLMS）の急速な進歩は、計算需要の前例のない増加と並 … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

Quantum Optimization via Gradient-Based Hamiltonian Descent

投稿日: 2025年5月21日作成者: jarxiv

要約機械学習の急速な進歩により、計算効率と低メモリ要件により、最新の最適化技術 … 続きを読む →

カテゴリー: cs.LG, math.OC, quant-ph | コメントを受け付けていません

Internal Chain-of-Thought: Empirical Evidence for Layer-wise Subtask Scheduling in LLMs

投稿日: 2025年5月21日作成者: jarxiv

要約大規模な言語モデル（LLMS）が$ \ textIT {内部チェーンオブオ … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Pivot Language for Low-Resource Machine Translation

投稿日: 2025年5月21日作成者: jarxiv

要約特定の言語のペアは、サイズが大きく、ドメインが多様な平行なコーパスの欠如に … 続きを読む →

カテゴリー: 68T50, cs.CL, cs.LG, I.2.7 | コメントを受け付けていません

Enhancing Learned Knowledge in LoRA Adapters Through Efficient Contrastive Decoding on Ascend NPUs

投稿日: 2025年5月21日作成者: jarxiv

要約 Huaweiクラウドユーザーは、アプリケーション固有のニーズに合わせて大規 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Energy-Efficient Deep Reinforcement Learning with Spiking Transformers

投稿日: 2025年5月21日作成者: jarxiv

要約エージェントベースのトランスは、複雑なタスクを解決する能力が実証されている … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Sinusoidal Initialization, Time for a New Start

投稿日: 2025年5月21日作成者: jarxiv

要約初期化は、深いニューラルネットワークトレーニングにおいて重要な役割を果たし … 続きを読む →

カテゴリー: cs.AI, cs.LG, G.3 | コメントを受け付けていません

KORGym: A Dynamic Game Platform for LLM Reasoning Evaluation

投稿日: 2025年5月21日作成者: jarxiv

要約大規模な言語モデル（LLMS）の最近の進歩は、推論能力を正確に評価するため … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Physics-Guided Learning of Meteorological Dynamics for Weather Downscaling and Forecasting

投稿日: 2025年5月21日作成者: jarxiv

要約気象予測は不可欠ですが、従来の数値気象予測（NWP）方法では計算集中的で物 … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

EquiBench: Benchmarking Large Language Models’ Understanding of Program Semantics via Equivalence Checking

投稿日: 2025年5月21日作成者: jarxiv

要約大規模な言語モデル（LLM）がコード関連のタスクに不可欠になると、中心的な … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, cs.PL, cs.SE | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

Quartet: Native FP4 Training Can Be Optimal for Large Language Models

Quantum Optimization via Gradient-Based Hamiltonian Descent

Internal Chain-of-Thought: Empirical Evidence for Layer-wise Subtask Scheduling in LLMs

Pivot Language for Low-Resource Machine Translation

Enhancing Learned Knowledge in LoRA Adapters Through Efficient Contrastive Decoding on Ascend NPUs

Energy-Efficient Deep Reinforcement Learning with Spiking Transformers

Sinusoidal Initialization, Time for a New Start

KORGym: A Dynamic Game Platform for LLM Reasoning Evaluation

Physics-Guided Learning of Meteorological Dynamics for Weather Downscaling and Forecasting

EquiBench: Benchmarking Large Language Models’ Understanding of Program Semantics via Equivalence Checking

最近の投稿

最近のコメント

アーカイブ

カテゴリー