「cs.CL」カテゴリーアーカイブ

Harnessing Negative Signals: Reinforcement Distillation from Teacher Data for LLM Reasoning

投稿日: 2025年6月2日作成者: jarxiv

要約モデルの蒸留の最近の進歩は、高度な推論モデルからのデータ（例：Deepse … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, I.2.6 | コメントを受け付けていません

ProRL: Prolonged Reinforcement Learning Expands Reasoning Boundaries in Large Language Models

投稿日: 2025年6月2日作成者: jarxiv

要約推論中心の言語モデルの最近の進歩により、強化学習（RL）は、検証可能な報酬 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Draw ALL Your Imagine: A Holistic Benchmark and Agent Framework for Complex Instruction-based Image Generation

投稿日: 2025年6月2日作成者: jarxiv

要約テキストからイメージ（T2I）生成の最近の進歩により、モデルはテキストの説 … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Deep Augmentation: Dropout as Augmentation for Self-Supervised Learning

投稿日: 2025年6月2日作成者: jarxiv

要約ドロップアウトの機械学習における普及にもかかわらず、データ増強の形態として … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

LegalEval-Q: A New Benchmark for The Quality Evaluation of LLM-Generated Legal Text

投稿日: 2025年6月2日作成者: jarxiv

要約大規模な言語モデル（LLM）が法的アプリケーションでますます使用されている … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Using Knowledge Graphs to harvest datasets for efficient CLIP model training

投稿日: 2025年6月2日作成者: jarxiv

要約高品質のクリップモデルのトレーニングには、通常、膨大なデータセットが必要で … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.IR, cs.LG | コメントを受け付けていません

Vision LLMs Are Bad at Hierarchical Visual Understanding, and LLMs Are the Bottleneck

投稿日: 2025年6月2日作成者: jarxiv

要約このペーパーでは、最先端の大規模な言語モデル（LLM）が私たちの視覚的世界 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

MoDoMoDo: Multi-Domain Data Mixtures for Multimodal LLM Reinforcement Learning

投稿日: 2025年6月2日作成者: jarxiv

要約検証可能な報酬（RLVR）による強化学習は、最近、トレーニング後の大手言語 … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

ProxyThinker: Test-Time Guidance through Small Visual Reasoners

投稿日: 2025年6月2日作成者: jarxiv

要約検証可能な報酬による強化学習の最近の進歩により、大規模なビジョン言語モデル … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

ReasonGen-R1: CoT for Autoregressive Image generation models through SFT and RL

投稿日: 2025年6月2日作成者: jarxiv

要約考え方の推論と強化学習（RL）がNLPのブレークスルーを駆動していますが、 … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

Harnessing Negative Signals: Reinforcement Distillation from Teacher Data for LLM Reasoning

ProRL: Prolonged Reinforcement Learning Expands Reasoning Boundaries in Large Language Models

Draw ALL Your Imagine: A Holistic Benchmark and Agent Framework for Complex Instruction-based Image Generation

Deep Augmentation: Dropout as Augmentation for Self-Supervised Learning

LegalEval-Q: A New Benchmark for The Quality Evaluation of LLM-Generated Legal Text

Using Knowledge Graphs to harvest datasets for efficient CLIP model training

Vision LLMs Are Bad at Hierarchical Visual Understanding, and LLMs Are the Bottleneck

MoDoMoDo: Multi-Domain Data Mixtures for Multimodal LLM Reinforcement Learning

ProxyThinker: Test-Time Guidance through Small Visual Reasoners

ReasonGen-R1: CoT for Autoregressive Image generation models through SFT and RL

最近の投稿

最近のコメント

アーカイブ

カテゴリー