月別アーカイブ: 2024年4月

State Space Model for New-Generation Network Alternative to Transformers: A Survey

投稿日: 2024年4月16日作成者: jarxiv

要約ディープラーニング後の時代において、Transformer アーキテクチャ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | コメントを受け付けていません

DiagGPT: An LLM-based and Multi-agent Dialogue System with Automatic Topic Management for Flexible Task-Oriented Dialogue

投稿日: 2024年4月16日作成者: jarxiv

要約 ChatGPT のような大規模言語モデル (LLM) の重要な用途は、さま … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Triad: A Framework Leveraging a Multi-Role LLM-based Agent to Solve Knowledge Base Question Answering

投稿日: 2024年4月16日作成者: jarxiv

要約 LLM ベースのエージェントの最近の進歩により、さまざまなタスクにわたって … 続きを読む →

カテゴリー: 68T50, cs.AI, cs.CL, I.2.7 | コメントを受け付けていません

Neuron-level LLM Patching for Code Generation

投稿日: 2024年4月16日作成者: jarxiv

要約大規模言語モデル (LLM) は、ソフトウェアエンジニアリング、特にコー … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SE | コメントを受け付けていません

Prepacking: A Simple Method for Fast Prefilling and Increased Throughput in Large Language Models

投稿日: 2024年4月16日作成者: jarxiv

要約トランスフォーマーベースの大規模言語モデル (LLM) の推論中、事前入力 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Large Language Models as Optimizers

投稿日: 2024年4月16日作成者: jarxiv

要約最適化は至る所で行われています。微分ベースのアルゴリズムはさまざまな問題 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Wisdom of Instruction-Tuned Language Model Crowds. Exploring Model Label Variation

投稿日: 2024年4月16日作成者: jarxiv

要約大規模言語モデル (LLM) は優れたテキスト分類機能を示し、ゼロショット … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Improving Recall of Large Language Models: A Model Collaboration Approach for Relational Triple Extraction

投稿日: 2024年4月16日作成者: jarxiv

要約長文からトリプルの集合を出力する関係トリプル抽出は知識獲得において重要な役 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

If there’s a Trigger Warning, then where’s the Trigger? Investigating Trigger Warnings at the Passage Level

投稿日: 2024年4月16日作成者: jarxiv

要約トリガー警告は、機密コンテンツが特定の読者グループに有害であると認識さ … 続きを読む →

カテゴリー: cs.CL, cs.CY | コメントを受け付けていません

Learn Your Reference Model for Real Good Alignment

投稿日: 2024年4月16日作成者: jarxiv

要約アライメント問題の複雑さは、既存の方法が不安定であるという事実に起因してい … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

月別アーカイブ: 2024年4月

State Space Model for New-Generation Network Alternative to Transformers: A Survey

DiagGPT: An LLM-based and Multi-agent Dialogue System with Automatic Topic Management for Flexible Task-Oriented Dialogue

Triad: A Framework Leveraging a Multi-Role LLM-based Agent to Solve Knowledge Base Question Answering

Neuron-level LLM Patching for Code Generation

Prepacking: A Simple Method for Fast Prefilling and Increased Throughput in Large Language Models

Large Language Models as Optimizers

Wisdom of Instruction-Tuned Language Model Crowds. Exploring Model Label Variation

Improving Recall of Large Language Models: A Model Collaboration Approach for Relational Triple Extraction

If there’s a Trigger Warning, then where’s the Trigger? Investigating Trigger Warnings at the Passage Level

Learn Your Reference Model for Real Good Alignment

最近の投稿

最近のコメント

アーカイブ

カテゴリー