「cs.CL」カテゴリーアーカイブ

Continual SFT Matches Multimodal RLHF with Negative Supervision

投稿日: 2024年11月25日作成者: jarxiv

要約マルチモーダル RLHF は通常、視覚言語モデル (VLM) の理解を継続 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Self-Training Meets Consistency: Improving LLMs’ Reasoning With Consistency-Driven Rationale Evaluation

投稿日: 2024年11月25日作成者: jarxiv

要約大規模言語モデル (LLM) の自己トレーニングアプローチは、自己生成さ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Xmodel-1.5: An 1B-scale Multilingual LLM

投稿日: 2024年11月25日作成者: jarxiv

要約 Xmodel-1.5 は、2 兆のトークンで事前トレーニングされた 10 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Delving into the Reversal Curse: How Far Can Large Language Models Generalize?

投稿日: 2024年11月25日作成者: jarxiv

要約大規模言語モデル (LLM) は前例のない機能を備えていますが、一見些細な … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Harlequin: Color-driven Generation of Synthetic Data for Referring Expression Comprehension

投稿日: 2024年11月25日作成者: jarxiv

要約参照表現理解 (REC) は、自然言語表現によってシーン内の特定のオブジェ … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Fine-Grained Alignment in Vision-and-Language Navigation through Bayesian Optimization

投稿日: 2024年11月25日作成者: jarxiv

要約この論文では、ロボットが自然言語の指示に基づいて現実的な 3D 環境をナビ … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

VisGraphVar: A Benchmark Generator for Assessing Variability in Graph Analysis Using Large Vision-Language Models

投稿日: 2024年11月25日作成者: jarxiv

要約 Large Vision-Language Model (LVLM) の急 … 続きを読む →

カテゴリー: 68T50, cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

From Novice to Expert: LLM Agent Policy Optimization via Step-wise Reinforcement Learning

投稿日: 2024年11月25日作成者: jarxiv

要約大規模言語モデル (LLM) の優れた機能により、LLM はさまざまな自律 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.HC, cs.RO | コメントを受け付けていません

Bone: Block-Affine Adaptation of Large Language Models

投稿日: 2024年11月25日作成者: jarxiv

要約低ランク適応 (LoRA) は、元の重みを凍結し、低ランクの行列のみをトレ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

GTA: A Benchmark for General Tool Agents

投稿日: 2024年11月25日作成者: jarxiv

要約汎用エージェントの開発では、大規模言語モデル (LLM) とさまざまなツー … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

Continual SFT Matches Multimodal RLHF with Negative Supervision

Self-Training Meets Consistency: Improving LLMs’ Reasoning With Consistency-Driven Rationale Evaluation

Xmodel-1.5: An 1B-scale Multilingual LLM

Delving into the Reversal Curse: How Far Can Large Language Models Generalize?

Harlequin: Color-driven Generation of Synthetic Data for Referring Expression Comprehension

Fine-Grained Alignment in Vision-and-Language Navigation through Bayesian Optimization

VisGraphVar: A Benchmark Generator for Assessing Variability in Graph Analysis Using Large Vision-Language Models

From Novice to Expert: LLM Agent Policy Optimization via Step-wise Reinforcement Learning

Bone: Block-Affine Adaptation of Large Language Models

GTA: A Benchmark for General Tool Agents

最近の投稿

最近のコメント

アーカイブ

カテゴリー