月別アーカイブ: 2024年4月

State Space Model for New-Generation Network Alternative to Transformers: A Survey

要約 ディープラーニング後の時代において、Transformer アーキテクチャ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | State Space Model for New-Generation Network Alternative to Transformers: A Survey はコメントを受け付けていません

DiagGPT: An LLM-based and Multi-agent Dialogue System with Automatic Topic Management for Flexible Task-Oriented Dialogue

要約 ChatGPT のような大規模言語モデル (LLM) の重要な用途は、さま … 続きを読む

カテゴリー: cs.AI, cs.CL | DiagGPT: An LLM-based and Multi-agent Dialogue System with Automatic Topic Management for Flexible Task-Oriented Dialogue はコメントを受け付けていません

Triad: A Framework Leveraging a Multi-Role LLM-based Agent to Solve Knowledge Base Question Answering

要約 LLM ベースのエージェントの最近の進歩により、さまざまなタスクにわたって … 続きを読む

カテゴリー: 68T50, cs.AI, cs.CL, I.2.7 | Triad: A Framework Leveraging a Multi-Role LLM-based Agent to Solve Knowledge Base Question Answering はコメントを受け付けていません

Neuron-level LLM Patching for Code Generation

要約 大規模言語モデル (LLM) は、ソフトウェア エンジニアリング、特にコー … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SE | Neuron-level LLM Patching for Code Generation はコメントを受け付けていません

Prepacking: A Simple Method for Fast Prefilling and Increased Throughput in Large Language Models

要約 トランスフォーマーベースの大規模言語モデル (LLM) の推論中、事前入力 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Prepacking: A Simple Method for Fast Prefilling and Increased Throughput in Large Language Models はコメントを受け付けていません

Large Language Models as Optimizers

要約 最適化は至る所で行われています。 微分ベースのアルゴリズムはさまざまな問題 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Large Language Models as Optimizers はコメントを受け付けていません

Wisdom of Instruction-Tuned Language Model Crowds. Exploring Model Label Variation

要約 大規模言語モデル (LLM) は優れたテキスト分類機能を示し、ゼロショット … 続きを読む

カテゴリー: cs.CL | Wisdom of Instruction-Tuned Language Model Crowds. Exploring Model Label Variation はコメントを受け付けていません

Improving Recall of Large Language Models: A Model Collaboration Approach for Relational Triple Extraction

要約 長文からトリプルの集合を出力する関係トリプル抽出は知識獲得において重要な役 … 続きを読む

カテゴリー: cs.CL | Improving Recall of Large Language Models: A Model Collaboration Approach for Relational Triple Extraction はコメントを受け付けていません

If there’s a Trigger Warning, then where’s the Trigger? Investigating Trigger Warnings at the Passage Level

要約 トリガー警告は、機密コンテンツが特定の読者グループに有害​​であると認識さ … 続きを読む

カテゴリー: cs.CL, cs.CY | If there’s a Trigger Warning, then where’s the Trigger? Investigating Trigger Warnings at the Passage Level はコメントを受け付けていません

Learn Your Reference Model for Real Good Alignment

要約 アライメント問題の複雑さは、既存の方法が不安定であるという事実に起因してい … 続きを読む

カテゴリー: cs.CL, cs.LG | Learn Your Reference Model for Real Good Alignment はコメントを受け付けていません