「cs.LG」カテゴリーアーカイブ

On Learning Verifiers for Chain-of-Thought Reasoning

投稿日: 2025年5月29日作成者: jarxiv

要約考え方の推論は、複雑な数学的および論理的な問題を解決するための強力なアプロ … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

AstroVisBench: A Code Benchmark for Scientific Computing and Visualization in Astronomy

投稿日: 2025年5月29日作成者: jarxiv

要約大規模な言語モデル（LLM）は、文献を統合し、研究の質問に答え、研究のアイ … 続きを読む →

カテゴリー: astro-ph.IM, cs.CL, cs.LG | コメントを受け付けていません

Unsupervised Post-Training for Multi-Modal LLM Reasoning via GRPO

投稿日: 2025年5月29日作成者: jarxiv

要約トレーニング後の段階でのマルチモーダル大手言語モデル（MLLMS）の改善は … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

FitCF: A Framework for Automatic Feature Importance-guided Counterfactual Example Generation

投稿日: 2025年5月29日作成者: jarxiv

要約反事実的な例は、モデルを改善するための貴重なデータとして、およびモデルの行 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Closed-Form Training Dynamics Reveal Learned Features and Linear Structure in Word2Vec-like Models

投稿日: 2025年5月29日作成者: jarxiv

要約 Word2vecなどの自己監視ワード埋め込みアルゴリズムは、言語モデリング … 続きを読む →

カテゴリー: cs.CL, cs.LG, stat.ML | コメントを受け付けていません

AutoElicit: Using Large Language Models for Expert Prior Elicitation in Predictive Modelling

投稿日: 2025年5月29日作成者: jarxiv

要約大規模な言語モデル（LLMS）は、さまざまなドメインで幅広い情報を取得しま … 続きを読む →

カテゴリー: cs.CL, cs.LG, stat.ML | コメントを受け付けていません

Bridging Supervised Learning and Reinforcement Learning in Math Reasoning

投稿日: 2025年5月29日作成者: jarxiv

要約強化学習（RL）は、バイナリ検証信号を通じて自己改善を可能にすることにより … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

AutoL2S: Auto Long-Short Reasoning for Efficient Large Language Models

投稿日: 2025年5月29日作成者: jarxiv

要約推論対応の大規模な言語モデル（LLMS）は、複雑な推論タスクで強力なパフォ … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Position: Don’t Use the CLT in LLM Evals With Fewer Than a Few Hundred Datapoints

投稿日: 2025年5月29日作成者: jarxiv

要約有効なエラーバーや有意性テストを含む、大規模な言語モデル（LLM）の厳密な … 続きを読む →

カテゴリー: cs.AI, cs.LG, stat.ML | コメントを受け付けていません

On the Surprising Effectiveness of Large Learning Rates under Standard Width Scaling

投稿日: 2025年5月29日作成者: jarxiv

要約大規模なビジョンモデルと言語モデルをトレーニングするための主要なパラダイム … 続きを読む →

カテゴリー: cs.AI, cs.LG, stat.ML | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

On Learning Verifiers for Chain-of-Thought Reasoning

AstroVisBench: A Code Benchmark for Scientific Computing and Visualization in Astronomy

Unsupervised Post-Training for Multi-Modal LLM Reasoning via GRPO

FitCF: A Framework for Automatic Feature Importance-guided Counterfactual Example Generation

Closed-Form Training Dynamics Reveal Learned Features and Linear Structure in Word2Vec-like Models

AutoElicit: Using Large Language Models for Expert Prior Elicitation in Predictive Modelling

Bridging Supervised Learning and Reinforcement Learning in Math Reasoning

AutoL2S: Auto Long-Short Reasoning for Efficient Large Language Models

Position: Don’t Use the CLT in LLM Evals With Fewer Than a Few Hundred Datapoints

On the Surprising Effectiveness of Large Learning Rates under Standard Width Scaling

最近の投稿

最近のコメント

アーカイブ

カテゴリー