cs.LG」カテゴリーアーカイブ

Towards Quantifying the Hessian Structure of Neural Networks

要約 実証研究は、ニューラルネットワークのヘシアンマトリックス(NNS)が遮断に … 続きを読む

カテゴリー: cs.LG, math.OC, stat.ML | Towards Quantifying the Hessian Structure of Neural Networks はコメントを受け付けていません

Impact of Noisy Supervision in Foundation Model Learning

要約 基礎モデルは通常、大規模なデータセットで事前に訓練されており、チューニング … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Impact of Noisy Supervision in Foundation Model Learning はコメントを受け付けていません

Almost AI, Almost Human: The Challenge of Detecting AI-Polished Writing

要約 テキスト生成のための大規模な言語モデル(LLMS)の使用の増加により、AI … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.HC, cs.LG | Almost AI, Almost Human: The Challenge of Detecting AI-Polished Writing はコメントを受け付けていません

JTCSE: Joint Tensor-Modulus Constraints and Cross-Attention for Unsupervised Contrastive Learning of Sentence Embeddings

要約 監視されていない対照学習は、自然言語処理のホットな研究トピックになりました … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | JTCSE: Joint Tensor-Modulus Constraints and Cross-Attention for Unsupervised Contrastive Learning of Sentence Embeddings はコメントを受け付けていません

RM-R1: Reward Modeling as Reasoning

要約 報酬モデリングは、特に人間のフィードバック(RLHF)からの強化学習を通じ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | RM-R1: Reward Modeling as Reasoning はコメントを受け付けていません

Optimizing Chain-of-Thought Reasoners via Gradient Variance Minimization in Rejection Sampling and RL

要約 大規模な言語モデル(LLMS)のチェーンオブテーブ(COT)推論は、潜在的 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Optimizing Chain-of-Thought Reasoners via Gradient Variance Minimization in Rejection Sampling and RL はコメントを受け付けていません

Unveiling the Mechanisms of Explicit CoT Training: How CoT Enhances Reasoning Generalization

要約 大規模な言語モデル(LLMS)のトレーニングへの明示的なチェーン(COT) … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Unveiling the Mechanisms of Explicit CoT Training: How CoT Enhances Reasoning Generalization はコメントを受け付けていません

Bielik v3 Small: Technical Report

要約 ポーランド語処理用に最適化された一連のパラメーター効率の高い生成テキストモ … 続きを読む

カテゴリー: 68T50, cs.AI, cs.CL, cs.LG, I.2.7 | Bielik v3 Small: Technical Report はコメントを受け付けていません

EMORL: Ensemble Multi-Objective Reinforcement Learning for Efficient and Flexible LLM Fine-Tuning

要約 大規模な言語モデル(LLM)の補強学習(RL)の最近の進歩は、多目的タスク … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | EMORL: Ensemble Multi-Objective Reinforcement Learning for Efficient and Flexible LLM Fine-Tuning はコメントを受け付けていません

APIGen-MT: Agentic Pipeline for Multi-Turn Data Generation via Simulated Agent-Human Interplay

要約 マルチターン相互作用のための効果的なAIエージェントのトレーニングには、現 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | APIGen-MT: Agentic Pipeline for Multi-Turn Data Generation via Simulated Agent-Human Interplay はコメントを受け付けていません