投稿者「jarxiv」のアーカイブ

LLaVA-CMoE: Towards Continual Mixture of Experts for Large Vision-Language Models

要約 エキスパート(MOE)の混合物は、最近、継続的なマルチモーダル学習のための … 続きを読む

カテゴリー: cs.CL | LLaVA-CMoE: Towards Continual Mixture of Experts for Large Vision-Language Models はコメントを受け付けていません

Improving Causal Interventions in Amnesic Probing with Mean Projection or LEACE

要約 健忘環境は、モデルの挙動に関する特定の言語情報の影響を調べるために使用され … 続きを読む

カテゴリー: cs.AI, cs.CL | Improving Causal Interventions in Amnesic Probing with Mean Projection or LEACE はコメントを受け付けていません

LLMs for Sentence Simplification: A Hybrid Multi-Agent prompting Approach

要約 このペーパーでは、複雑な文章を論理的で単純化した文のシーケンスに変換すると … 続きを読む

カテゴリー: cs.CL | LLMs for Sentence Simplification: A Hybrid Multi-Agent prompting Approach はコメントを受け付けていません

Configurable Preference Tuning with Rubric-Guided Synthetic Data

要約 直接選好最適化(DPO)を支えるなど、AIアライメントの人間のフィードバッ … 続きを読む

カテゴリー: cs.AI, cs.CL | Configurable Preference Tuning with Rubric-Guided Synthetic Data はコメントを受け付けていません

The Cambrian Explosion of Mixed-Precision Matrix Multiplication for Quantized Deep Learning Inference

要約 Deep Learning(DL)の最近の進歩により、FP16、BF16、 … 続きを読む

カテゴリー: cs.CL | The Cambrian Explosion of Mixed-Precision Matrix Multiplication for Quantized Deep Learning Inference はコメントを受け付けていません

VM14K: First Vietnamese Medical Benchmark

要約 医療ベンチマークは、英語を話す非英語を話すコミュニティのヘルスケアにおける … 続きを読む

カテゴリー: cs.CL | VM14K: First Vietnamese Medical Benchmark はコメントを受け付けていません

Entropy Controllable Direct Preference Optimization

要約 大規模な言語モデル(LLM)の訓練後、人間のフィードバック(RLHF)から … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Entropy Controllable Direct Preference Optimization はコメントを受け付けていません

Table-R1: Region-based Reinforcement Learning for Table Understanding

要約 テーブルは、構造化された列列相互作用のために言語モデルのユニークな課題を提 … 続きを読む

カテゴリー: cs.AI, cs.CL | Table-R1: Region-based Reinforcement Learning for Table Understanding はコメントを受け付けていません

DART: Distilling Autoregressive Reasoning to Silent Thought

要約 チェーンオブテーブ(COT)の推論は、複雑なタスクの解決において大規模な言 … 続きを読む

カテゴリー: cs.CL | DART: Distilling Autoregressive Reasoning to Silent Thought はコメントを受け付けていません

DeepResearch Bench: A Comprehensive Benchmark for Deep Research Agents

要約 ディープリサーチエージェントは、LLMベースのエージェントの顕著なカテゴリ … 続きを読む

カテゴリー: cs.CL, cs.IR | DeepResearch Bench: A Comprehensive Benchmark for Deep Research Agents はコメントを受け付けていません