「cs.LG」カテゴリーアーカイブ

Langevin Multiplicative Weights Update with Applications in Polynomial Portfolio Management

投稿日: 2025年3月4日作成者: jarxiv

要約本論文では，非凸最適化問題をシンプレックス（より一般的には，シンプレックス … 続きを読む →

カテゴリー: cs.LG, math.OC, Non-convex optimization | コメントを受け付けていません

‘FRAME: Forward Recursive Adaptive Model Extraction-A Technique for Advance Feature Selection’

投稿日: 2025年3月4日作成者: jarxiv

要約特徴選択における課題、特にモデルの精度、解釈可能性、計算効率のバランスは、 … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

CAMEx: Curvature-aware Merging of Experts

投稿日: 2025年3月4日作成者: jarxiv

要約モデルの学習や微調整の際にエキスパートをマージする既存の手法は、主に平坦な … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

Iterative Nash Policy Optimization: Aligning LLMs with General Preferences via No-Regret Learning

投稿日: 2025年3月4日作成者: jarxiv

要約人間のフィードバックによる強化学習（RLHF）は、大規模な言語モデル（LL … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.GT, cs.LG | コメントを受け付けていません

Generative Representational Instruction Tuning

投稿日: 2025年3月4日作成者: jarxiv

要約テキストベースの言語問題はすべて、生成か埋め込みのどちらかに還元できる。現 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

TokenSelect: Efficient Long-Context Inference and Length Extrapolation for LLMs via Dynamic Token-Level KV Cache Selection

投稿日: 2025年3月4日作成者: jarxiv

要約大規模言語モデル（Large Language Models: LLM）の … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

SpikeLLM: Scaling up Spiking Neural Network to Large Language Models via Saliency-based Spiking

投稿日: 2025年3月4日作成者: jarxiv

要約近年、数十億ものパラメータを持つ大規模言語モデル（LLM）が進歩し、様々な … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.NE | コメントを受け付けていません

Test-Time Compute: from System-1 Thinking to System-2 Thinking

投稿日: 2025年3月4日作成者: jarxiv

要約複雑な推論におけるo1モデルの顕著な性能は、テスト時間の計算スケーリングが … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

DailyDilemmas: Revealing Value Preferences of LLMs with Quandaries of Daily Life

投稿日: 2025年3月4日作成者: jarxiv

要約日常生活における意思決定において、ユーザーがLLMのガイダンスを求めること … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Robust Preference Optimization through Reward Model Distillation

投稿日: 2025年3月4日作成者: jarxiv

要約言語モデル（LM）のポストトレーニング（またはアライメント）には、嗜好アノ … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

Langevin Multiplicative Weights Update with Applications in Polynomial Portfolio Management

‘FRAME: Forward Recursive Adaptive Model Extraction-A Technique for Advance Feature Selection’

CAMEx: Curvature-aware Merging of Experts

Iterative Nash Policy Optimization: Aligning LLMs with General Preferences via No-Regret Learning

Generative Representational Instruction Tuning

TokenSelect: Efficient Long-Context Inference and Length Extrapolation for LLMs via Dynamic Token-Level KV Cache Selection

SpikeLLM: Scaling up Spiking Neural Network to Large Language Models via Saliency-based Spiking

Test-Time Compute: from System-1 Thinking to System-2 Thinking

DailyDilemmas: Revealing Value Preferences of LLMs with Quandaries of Daily Life

Robust Preference Optimization through Reward Model Distillation

最近の投稿

最近のコメント

アーカイブ

カテゴリー