「cs.CL」カテゴリーアーカイブ

RAGChecker: A Fine-grained Framework for Diagnosing Retrieval-Augmented Generation

投稿日: 2024年8月16日作成者: jarxiv

要約検索拡張生成 (RAG) は外部知識を活用する有望な機能を示していますが、 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

MS-HuBERT: Mitigating Pre-training and Inference Mismatch in Masked Language Modelling methods for learning Speech Representations

投稿日: 2024年8月16日作成者: jarxiv

要約近年、生の音声から高レベルの情報を学習する際に、自己教師ありの事前トレーニ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

I-SHEEP: Self-Alignment of LLM from Scratch through an Iterative Self-Enhancement Paradigm

投稿日: 2024年8月16日作成者: jarxiv

要約大規模言語モデル (LLM) は大幅な進歩を遂げていますが、一般的な学習パ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Extracting Sentence Embeddings from Pretrained Transformer Models

投稿日: 2024年8月16日作成者: jarxiv

要約背景/はじめに: 事前トレーニングされたトランスフォーマーモデルは、多く … 続きを読む →

カテゴリー: 68T05, 68T07, 68T50, cs.CL, cs.IR, cs.LG, I.2.6, stat.ML | コメントを受け付けていません

AgentCourt: Simulating Court with Adversarial Evolvable Lawyer Agents

投稿日: 2024年8月16日作成者: jarxiv

要約この論文では、法廷プロセス全体をシミュレートする AgentCourt と … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

EUvsDisinfo: a Dataset for Multilingual Detection of Pro-Kremlin Disinformation in News Articles

投稿日: 2024年8月16日作成者: jarxiv

要約この作品では、親クレムリンのテーマに関連する信頼できる偽情報記事の多言語デ … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

MIDAS: Multi-level Intent, Domain, And Slot Knowledge Distillation for Multi-turn NLU

投稿日: 2024年8月16日作成者: jarxiv

要約大規模言語モデル (LLM) は、一貫した文脈に関連したテキストを生成でき … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

KOALA: Enhancing Speculative Decoding for LLM via Multi-Layer Draft Heads with Adversarial Learning

投稿日: 2024年8月16日作成者: jarxiv

要約大規模言語モデル (LLM) は、自己回帰デコードの性質により、高い推論遅 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

P/D-Serve: Serving Disaggregated Large Language Model at Scale

投稿日: 2024年8月16日作成者: jarxiv

要約信頼性の高いパフォーマンスで数万台の xPU デバイス (GPU または … 続きを読む →

カテゴリー: cs.CL, cs.DC, cs.LG | コメントを受け付けていません

Large Language Models are Few-Shot Training Example Generators: A Case Study in Fallacy Recognition

投稿日: 2024年8月16日作成者: jarxiv

要約誤謬を認識することは、さまざまな領域にわたる議論の質と妥当性を確保するため … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

RAGChecker: A Fine-grained Framework for Diagnosing Retrieval-Augmented Generation

MS-HuBERT: Mitigating Pre-training and Inference Mismatch in Masked Language Modelling methods for learning Speech Representations

I-SHEEP: Self-Alignment of LLM from Scratch through an Iterative Self-Enhancement Paradigm

Extracting Sentence Embeddings from Pretrained Transformer Models

AgentCourt: Simulating Court with Adversarial Evolvable Lawyer Agents

EUvsDisinfo: a Dataset for Multilingual Detection of Pro-Kremlin Disinformation in News Articles

MIDAS: Multi-level Intent, Domain, And Slot Knowledge Distillation for Multi-turn NLU

KOALA: Enhancing Speculative Decoding for LLM via Multi-Layer Draft Heads with Adversarial Learning

P/D-Serve: Serving Disaggregated Large Language Model at Scale

Large Language Models are Few-Shot Training Example Generators: A Case Study in Fallacy Recognition

最近の投稿

最近のコメント

アーカイブ

カテゴリー