cs.LG」カテゴリーアーカイブ

Rethinking LLM Advancement: Compute-Dependent and Independent Paths to Progress

要約 大規模な言語モデル(LLM)開発を管理する規制の取り組みは、主に高性能計算 … 続きを読む

カテゴリー: cs.AI, cs.LG, I.2 | コメントする

Just Enough Thinking: Efficient Reasoning with Adaptive Length Penalties Reinforcement Learning

要約 大きな推論モデル(LRMS)は、推論時により多くのトークンを生成することに … 続きを読む

カテゴリー: cs.AI, cs.LG | コメントする

Context is Key: A Benchmark for Forecasting with Essential Textual Information

要約 予測は、多くのドメインにわたる意思決定における重要なタスクです。 履歴数値 … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | コメントする

Fast-DataShapley: Neural Modeling for Training Data Valuation

要約 トレーニングデータの価値と著作権は、人工知能業界で重要です。 サービスプラ … 続きを読む

カテゴリー: cs.AI, cs.LG | コメントする

Sample Complexity and Representation Ability of Test-time Scaling Paradigms

要約 テスト時間スケーリングパラダイムは、複雑なタスク上の大規模な言語モデル(L … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | コメントする

Control Tax: The Price of Keeping AI in Check

要約 エージェントAIをハイステークスの現実世界アプリケーションに迅速に統合する … 続きを読む

カテゴリー: cs.AI, cs.LG | コメントする

ProRefine: Inference-time Prompt Refinement with Textual Feedback

要約 複数のAIエージェントが協力して推論や計画などの複雑なタスクを達成するエー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

Constrained Entropic Unlearning: A Primal-Dual Framework for Large Language Models

要約 現実世界の設定で展開された大規模な言語モデル(LLM)は、繊細、時代遅れ、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

Improving Data Efficiency for LLM Reinforcement Fine-tuning Through Difficulty-targeted Online Data Selection and Rollout Replay

要約 強化学習(RL)は、特に推論能力を高めるために、大規模な言語モデル(LLM … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

AceReason-Nemotron: Advancing Math and Code Reasoning through Reinforcement Learning

要約 推論のための大規模な強化学習(RL)の最近の進歩にもかかわらず、高性能の推 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする