cs.CL」カテゴリーアーカイブ

RAGChecker: A Fine-grained Framework for Diagnosing Retrieval-Augmented Generation

要約 検索拡張生成 (RAG) は外部知識を活用する有望な機能を示していますが、 … 続きを読む

カテゴリー: cs.AI, cs.CL | RAGChecker: A Fine-grained Framework for Diagnosing Retrieval-Augmented Generation はコメントを受け付けていません

MS-HuBERT: Mitigating Pre-training and Inference Mismatch in Masked Language Modelling methods for learning Speech Representations

要約 近年、生の音声から高レベルの情報を学習する際に、自己教師ありの事前トレーニ … 続きを読む

カテゴリー: cs.CL | MS-HuBERT: Mitigating Pre-training and Inference Mismatch in Masked Language Modelling methods for learning Speech Representations はコメントを受け付けていません

I-SHEEP: Self-Alignment of LLM from Scratch through an Iterative Self-Enhancement Paradigm

要約 大規模言語モデル (LLM) は大幅な進歩を遂げていますが、一般的な学習パ … 続きを読む

カテゴリー: cs.CL | I-SHEEP: Self-Alignment of LLM from Scratch through an Iterative Self-Enhancement Paradigm はコメントを受け付けていません

Extracting Sentence Embeddings from Pretrained Transformer Models

要約 背景/はじめに: 事前トレーニングされたトランスフォーマー モデルは、多く … 続きを読む

カテゴリー: 68T05, 68T07, 68T50, cs.CL, cs.IR, cs.LG, I.2.6, stat.ML | Extracting Sentence Embeddings from Pretrained Transformer Models はコメントを受け付けていません

AgentCourt: Simulating Court with Adversarial Evolvable Lawyer Agents

要約 この論文では、法廷プロセス全体をシミュレートする AgentCourt と … 続きを読む

カテゴリー: cs.AI, cs.CL | AgentCourt: Simulating Court with Adversarial Evolvable Lawyer Agents はコメントを受け付けていません

EUvsDisinfo: a Dataset for Multilingual Detection of Pro-Kremlin Disinformation in News Articles

要約 この作品では、親クレムリンのテーマに関連する信頼できる偽情報記事の多言語デ … 続きを読む

カテゴリー: cs.CL, cs.LG | EUvsDisinfo: a Dataset for Multilingual Detection of Pro-Kremlin Disinformation in News Articles はコメントを受け付けていません

MIDAS: Multi-level Intent, Domain, And Slot Knowledge Distillation for Multi-turn NLU

要約 大規模言語モデル (LLM) は、一貫した文脈に関連したテキストを生成でき … 続きを読む

カテゴリー: cs.CL | MIDAS: Multi-level Intent, Domain, And Slot Knowledge Distillation for Multi-turn NLU はコメントを受け付けていません

KOALA: Enhancing Speculative Decoding for LLM via Multi-Layer Draft Heads with Adversarial Learning

要約 大規模言語モデル (LLM) は、自己回帰デコードの性質により、高い推論遅 … 続きを読む

カテゴリー: cs.CL | KOALA: Enhancing Speculative Decoding for LLM via Multi-Layer Draft Heads with Adversarial Learning はコメントを受け付けていません

P/D-Serve: Serving Disaggregated Large Language Model at Scale

要約 信頼性の高いパフォーマンスで数万台の xPU デバイス (GPU または … 続きを読む

カテゴリー: cs.CL, cs.DC, cs.LG | P/D-Serve: Serving Disaggregated Large Language Model at Scale はコメントを受け付けていません

Large Language Models are Few-Shot Training Example Generators: A Case Study in Fallacy Recognition

要約 誤謬を認識することは、さまざまな領域にわたる議論の質と妥当性を確保するため … 続きを読む

カテゴリー: cs.CL | Large Language Models are Few-Shot Training Example Generators: A Case Study in Fallacy Recognition はコメントを受け付けていません