cs.CL」カテゴリーアーカイブ

Harnessing Negative Signals: Reinforcement Distillation from Teacher Data for LLM Reasoning

要約 モデルの蒸留の最近の進歩は、高度な推論モデルからのデータ(例:Deepse … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, I.2.6 | Harnessing Negative Signals: Reinforcement Distillation from Teacher Data for LLM Reasoning はコメントを受け付けていません

ProRL: Prolonged Reinforcement Learning Expands Reasoning Boundaries in Large Language Models

要約 推論中心の言語モデルの最近の進歩により、強化学習(RL)は、検証可能な報酬 … 続きを読む

カテゴリー: cs.AI, cs.CL | ProRL: Prolonged Reinforcement Learning Expands Reasoning Boundaries in Large Language Models はコメントを受け付けていません

Draw ALL Your Imagine: A Holistic Benchmark and Agent Framework for Complex Instruction-based Image Generation

要約 テキストからイメージ(T2I)生成の最近の進歩により、モデルはテキストの説 … 続きを読む

カテゴリー: cs.CL, cs.CV | Draw ALL Your Imagine: A Holistic Benchmark and Agent Framework for Complex Instruction-based Image Generation はコメントを受け付けていません

Deep Augmentation: Dropout as Augmentation for Self-Supervised Learning

要約 ドロップアウトの機械学習における普及にもかかわらず、データ増強の形態として … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Deep Augmentation: Dropout as Augmentation for Self-Supervised Learning はコメントを受け付けていません

LegalEval-Q: A New Benchmark for The Quality Evaluation of LLM-Generated Legal Text

要約 大規模な言語モデル(LLM)が法的アプリケーションでますます使用されている … 続きを読む

カテゴリー: cs.CL, cs.CV | LegalEval-Q: A New Benchmark for The Quality Evaluation of LLM-Generated Legal Text はコメントを受け付けていません

Using Knowledge Graphs to harvest datasets for efficient CLIP model training

要約 高品質のクリップモデルのトレーニングには、通常、膨大なデータセットが必要で … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.IR, cs.LG | Using Knowledge Graphs to harvest datasets for efficient CLIP model training はコメントを受け付けていません

Vision LLMs Are Bad at Hierarchical Visual Understanding, and LLMs Are the Bottleneck

要約 このペーパーでは、最先端の大規模な言語モデル(LLM)が私たちの視覚的世界 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Vision LLMs Are Bad at Hierarchical Visual Understanding, and LLMs Are the Bottleneck はコメントを受け付けていません

MoDoMoDo: Multi-Domain Data Mixtures for Multimodal LLM Reinforcement Learning

要約 検証可能な報酬(RLVR)による強化学習は、最近、トレーニング後の大手言語 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | MoDoMoDo: Multi-Domain Data Mixtures for Multimodal LLM Reinforcement Learning はコメントを受け付けていません

ProxyThinker: Test-Time Guidance through Small Visual Reasoners

要約 検証可能な報酬による強化学習の最近の進歩により、大規模なビジョン言語モデル … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | ProxyThinker: Test-Time Guidance through Small Visual Reasoners はコメントを受け付けていません

ReasonGen-R1: CoT for Autoregressive Image generation models through SFT and RL

要約 考え方の推論と強化学習(RL)がNLPのブレークスルーを駆動していますが、 … 続きを読む

カテゴリー: cs.CL, cs.CV | ReasonGen-R1: CoT for Autoregressive Image generation models through SFT and RL はコメントを受け付けていません