cs.CL」カテゴリーアーカイブ

Continual SFT Matches Multimodal RLHF with Negative Supervision

要約 マルチモーダル RLHF は通常、視覚言語モデル (VLM) の理解を継続 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Continual SFT Matches Multimodal RLHF with Negative Supervision はコメントを受け付けていません

Self-Training Meets Consistency: Improving LLMs’ Reasoning With Consistency-Driven Rationale Evaluation

要約 大規模言語モデル (LLM) の自己トレーニング アプローチは、自己生成さ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Self-Training Meets Consistency: Improving LLMs’ Reasoning With Consistency-Driven Rationale Evaluation はコメントを受け付けていません

Xmodel-1.5: An 1B-scale Multilingual LLM

要約 Xmodel-1.5 は、2 兆のトークンで事前トレーニングされた 10 … 続きを読む

カテゴリー: cs.CL | Xmodel-1.5: An 1B-scale Multilingual LLM はコメントを受け付けていません

Delving into the Reversal Curse: How Far Can Large Language Models Generalize?

要約 大規模言語モデル (LLM) は前例のない機能を備えていますが、一見些細な … 続きを読む

カテゴリー: cs.CL | Delving into the Reversal Curse: How Far Can Large Language Models Generalize? はコメントを受け付けていません

Harlequin: Color-driven Generation of Synthetic Data for Referring Expression Comprehension

要約 参照表現理解 (REC) は、自然言語表現によってシーン内の特定のオブジェ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Harlequin: Color-driven Generation of Synthetic Data for Referring Expression Comprehension はコメントを受け付けていません

Fine-Grained Alignment in Vision-and-Language Navigation through Bayesian Optimization

要約 この論文では、ロボットが自然言語の指示に基づいて現実的な 3D 環境をナビ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Fine-Grained Alignment in Vision-and-Language Navigation through Bayesian Optimization はコメントを受け付けていません

VisGraphVar: A Benchmark Generator for Assessing Variability in Graph Analysis Using Large Vision-Language Models

要約 Large Vision-Language Model (LVLM) の急 … 続きを読む

カテゴリー: 68T50, cs.AI, cs.CL, cs.CV, cs.LG | VisGraphVar: A Benchmark Generator for Assessing Variability in Graph Analysis Using Large Vision-Language Models はコメントを受け付けていません

From Novice to Expert: LLM Agent Policy Optimization via Step-wise Reinforcement Learning

要約 大規模言語モデル (LLM) の優れた機能により、LLM はさまざまな自律 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.HC, cs.RO | From Novice to Expert: LLM Agent Policy Optimization via Step-wise Reinforcement Learning はコメントを受け付けていません

Bone: Block-Affine Adaptation of Large Language Models

要約 低ランク適応 (LoRA) は、元の重みを凍結し、低ランクの行列のみをトレ … 続きを読む

カテゴリー: cs.AI, cs.CL | Bone: Block-Affine Adaptation of Large Language Models はコメントを受け付けていません

GTA: A Benchmark for General Tool Agents

要約 汎用エージェントの開発では、大規模言語モデル (LLM) とさまざまなツー … 続きを読む

カテゴリー: cs.AI, cs.CL | GTA: A Benchmark for General Tool Agents はコメントを受け付けていません