cs.LG」カテゴリーアーカイブ

Preconditioned Inexact Stochastic ADMM for Deep Model

要約 近年、基礎モデル(FM)の進歩はパラダイムシフトをもたらし、世界中の様々な … 続きを読む

カテゴリー: cs.LG | コメントする

Gradient-Based Multi-Objective Deep Learning: Algorithms, Theories, Applications, and Beyond

要約 深層学習における多目的最適化(MOO)は、複数の相反する目的を同時に最適化 … 続きを読む

カテゴリー: cs.LG, stat.ML | コメントする

Langevin Multiplicative Weights Update with Applications in Polynomial Portfolio Management

要約 本論文では,非凸最適化問題をシンプレックス(より一般的には,シンプレックス … 続きを読む

カテゴリー: cs.LG, math.OC, Non-convex optimization | コメントする

‘FRAME: Forward Recursive Adaptive Model Extraction-A Technique for Advance Feature Selection’

要約 特徴選択における課題、特にモデルの精度、解釈可能性、計算効率のバランスは、 … 続きを読む

カテゴリー: cs.LG | コメントする

CAMEx: Curvature-aware Merging of Experts

要約 モデルの学習や微調整の際にエキスパートをマージする既存の手法は、主に平坦な … 続きを読む

カテゴリー: cs.LG | コメントする

Iterative Nash Policy Optimization: Aligning LLMs with General Preferences via No-Regret Learning

要約 人間のフィードバックによる強化学習(RLHF)は、大規模な言語モデル(LL … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.GT, cs.LG | コメントする

Generative Representational Instruction Tuning

要約 テキストベースの言語問題はすべて、生成か埋め込みのどちらかに還元できる。現 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

TokenSelect: Efficient Long-Context Inference and Length Extrapolation for LLMs via Dynamic Token-Level KV Cache Selection

要約 大規模言語モデル(Large Language Models: LLM)の … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

SpikeLLM: Scaling up Spiking Neural Network to Large Language Models via Saliency-based Spiking

要約 近年、数十億ものパラメータを持つ大規模言語モデル(LLM)が進歩し、様々な … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.NE | コメントする

Test-Time Compute: from System-1 Thinking to System-2 Thinking

要約 複雑な推論におけるo1モデルの顕著な性能は、テスト時間の計算スケーリングが … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする