cs.CL」カテゴリーアーカイブ

Mini-batch Coresets for Memory-efficient Training of Large Language Models

要約 より大きなミニバッチを使用してトレーニングすると、収束率が向上し、優れたパ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Mini-batch Coresets for Memory-efficient Training of Large Language Models はコメントを受け付けていません

DelTA: An Online Document-Level Translation Agent Based on Multi-Level Memory

要約 大規模言語モデル (LLM) は、機械翻訳 (MT) の品質を合理的に向上 … 続きを読む

カテゴリー: cs.AI, cs.CL | DelTA: An Online Document-Level Translation Agent Based on Multi-Level Memory はコメントを受け付けていません

Sample then Identify: A General Framework for Risk Control and Assessment in Multimodal Large Language Models

要約 マルチモーダル大規模言語モデル (MLLM) は、さまざまなタスクにわたっ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.MM | Sample then Identify: A General Framework for Risk Control and Assessment in Multimodal Large Language Models はコメントを受け付けていません

$\textbf{PLUM}$: Improving Code LMs with Execution-Guided On-Policy Preference Learning Driven By Synthetic Test Cases

要約 優先学習は、正しいコードと間違ったコードを区別するようにモデルが明示的にト … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.PL, cs.SE | $\textbf{PLUM}$: Improving Code LMs with Execution-Guided On-Policy Preference Learning Driven By Synthetic Test Cases はコメントを受け付けていません

From Exploration to Mastery: Enabling LLMs to Master Tools via Self-Driven Interactions

要約 ツール学習により、大規模言語モデル (LLM) はツールを呼び出して外部環 … 続きを読む

カテゴリー: cs.AI, cs.CL | From Exploration to Mastery: Enabling LLMs to Master Tools via Self-Driven Interactions はコメントを受け付けていません

PaliGemma: A versatile 3B VLM for transfer

要約 PaliGemma は、SigLIP-So400m ビジョン エンコーダと … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | PaliGemma: A versatile 3B VLM for transfer はコメントを受け付けていません

Insight Over Sight? Exploring the Vision-Knowledge Conflicts in Multimodal LLMs

要約 この論文では、視覚情報がモデルの内部常識知識と矛盾する、マルチモーダル大規 … 続きを読む

カテゴリー: cs.CL, cs.CV | Insight Over Sight? Exploring the Vision-Knowledge Conflicts in Multimodal LLMs はコメントを受け付けていません

Agent S: An Open Agentic Framework that Uses Computers Like a Human

要約 Agent S は、グラフィカル ユーザー インターフェイス (GUI) … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Agent S: An Open Agentic Framework that Uses Computers Like a Human はコメントを受け付けていません

MRAG-Bench: Vision-Centric Evaluation for Retrieval-Augmented Multimodal Models

要約 既存のマルチモーダル検索ベンチマークは、モデルが外部のテキスト知識を取得し … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | MRAG-Bench: Vision-Centric Evaluation for Retrieval-Augmented Multimodal Models はコメントを受け付けていません

MathCoder2: Better Math Reasoning from Continued Pretraining on Model-translated Mathematical Code

要約 コードは、その精度と精度により、大規模な言語モデルの数学的推論能力を強化す … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | MathCoder2: Better Math Reasoning from Continued Pretraining on Model-translated Mathematical Code はコメントを受け付けていません