cs.CL」カテゴリーアーカイブ

Bridging the Gap between Different Vocabularies for LLM Ensemble

要約 さまざまな大規模言語モデル (LLM) をアンサンブルして、相互補完的な可 … 続きを読む

カテゴリー: cs.CL | Bridging the Gap between Different Vocabularies for LLM Ensemble はコメントを受け付けていません

A Novel Paradigm Boosting Translation Capabilities of Large Language Models

要約 この論文では、機械翻訳 (MT) タスクのコンテキストで大規模言語モデル … 続きを読む

カテゴリー: cs.CL | A Novel Paradigm Boosting Translation Capabilities of Large Language Models はコメントを受け付けていません

Learning Planning-based Reasoning by Trajectories Collection and Process Reward Synthesizing

要約 大規模言語モデル (LLM) は、段階的な理論的根拠の生成を通じて複雑な推 … 続きを読む

カテゴリー: cs.AI, cs.CL | Learning Planning-based Reasoning by Trajectories Collection and Process Reward Synthesizing はコメントを受け付けていません

State Space Model for New-Generation Network Alternative to Transformers: A Survey

要約 ディープラーニング後の時代において、Transformer アーキテクチャ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | State Space Model for New-Generation Network Alternative to Transformers: A Survey はコメントを受け付けていません

DiagGPT: An LLM-based and Multi-agent Dialogue System with Automatic Topic Management for Flexible Task-Oriented Dialogue

要約 ChatGPT のような大規模言語モデル (LLM) の重要な用途は、さま … 続きを読む

カテゴリー: cs.AI, cs.CL | DiagGPT: An LLM-based and Multi-agent Dialogue System with Automatic Topic Management for Flexible Task-Oriented Dialogue はコメントを受け付けていません

Triad: A Framework Leveraging a Multi-Role LLM-based Agent to Solve Knowledge Base Question Answering

要約 LLM ベースのエージェントの最近の進歩により、さまざまなタスクにわたって … 続きを読む

カテゴリー: 68T50, cs.AI, cs.CL, I.2.7 | Triad: A Framework Leveraging a Multi-Role LLM-based Agent to Solve Knowledge Base Question Answering はコメントを受け付けていません

Neuron-level LLM Patching for Code Generation

要約 大規模言語モデル (LLM) は、ソフトウェア エンジニアリング、特にコー … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SE | Neuron-level LLM Patching for Code Generation はコメントを受け付けていません

Prepacking: A Simple Method for Fast Prefilling and Increased Throughput in Large Language Models

要約 トランスフォーマーベースの大規模言語モデル (LLM) の推論中、事前入力 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Prepacking: A Simple Method for Fast Prefilling and Increased Throughput in Large Language Models はコメントを受け付けていません

Large Language Models as Optimizers

要約 最適化は至る所で行われています。 微分ベースのアルゴリズムはさまざまな問題 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Large Language Models as Optimizers はコメントを受け付けていません

Wisdom of Instruction-Tuned Language Model Crowds. Exploring Model Label Variation

要約 大規模言語モデル (LLM) は優れたテキスト分類機能を示し、ゼロショット … 続きを読む

カテゴリー: cs.CL | Wisdom of Instruction-Tuned Language Model Crowds. Exploring Model Label Variation はコメントを受け付けていません