月別アーカイブ: 2024年8月

Extracting Sentence Embeddings from Pretrained Transformer Models

投稿日: 2024年8月16日作成者: jarxiv

要約背景/はじめに: 事前トレーニングされたトランスフォーマーモデルは、多く … 続きを読む →

カテゴリー: 68T05, 68T07, 68T50, cs.CL, cs.IR, cs.LG, I.2.6, stat.ML | コメントを受け付けていません

AgentCourt: Simulating Court with Adversarial Evolvable Lawyer Agents

投稿日: 2024年8月16日作成者: jarxiv

要約この論文では、法廷プロセス全体をシミュレートする AgentCourt と … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

EUvsDisinfo: a Dataset for Multilingual Detection of Pro-Kremlin Disinformation in News Articles

投稿日: 2024年8月16日作成者: jarxiv

要約この作品では、親クレムリンのテーマに関連する信頼できる偽情報記事の多言語デ … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

MIDAS: Multi-level Intent, Domain, And Slot Knowledge Distillation for Multi-turn NLU

投稿日: 2024年8月16日作成者: jarxiv

要約大規模言語モデル (LLM) は、一貫した文脈に関連したテキストを生成でき … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

KOALA: Enhancing Speculative Decoding for LLM via Multi-Layer Draft Heads with Adversarial Learning

投稿日: 2024年8月16日作成者: jarxiv

要約大規模言語モデル (LLM) は、自己回帰デコードの性質により、高い推論遅 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

P/D-Serve: Serving Disaggregated Large Language Model at Scale

投稿日: 2024年8月16日作成者: jarxiv

要約信頼性の高いパフォーマンスで数万台の xPU デバイス (GPU または … 続きを読む →

カテゴリー: cs.CL, cs.DC, cs.LG | コメントを受け付けていません

Large Language Models are Few-Shot Training Example Generators: A Case Study in Fallacy Recognition

投稿日: 2024年8月16日作成者: jarxiv

要約誤謬を認識することは、さまざまな領域にわたる議論の質と妥当性を確保するため … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Covert Bias: The Severity of Social Views’ Unalignment Towards Implicit and Explicit Opinion

投稿日: 2024年8月16日作成者: jarxiv

要約最近、バイアスを特定するためのさまざまなアプローチが研究されていますが、視 … 続きを読む →

カテゴリー: cs.CL, cs.CY | コメントを受け付けていません

Quantifying Memorization and Detecting Training Data of Pre-trained Language Models using Japanese Newspaper

投稿日: 2024年8月16日作成者: jarxiv

要約主要な事前トレーニング済み言語モデル (PLM) は、トレーニングデータ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

mhGPT: A Lightweight Generative Pre-Trained Transformer for Mental Health Text Analysis

投稿日: 2024年8月16日作成者: jarxiv

要約この論文では、メンタルヘルス関連のソーシャルメディアと PubMed の … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

月別アーカイブ: 2024年8月

Extracting Sentence Embeddings from Pretrained Transformer Models

AgentCourt: Simulating Court with Adversarial Evolvable Lawyer Agents

EUvsDisinfo: a Dataset for Multilingual Detection of Pro-Kremlin Disinformation in News Articles

MIDAS: Multi-level Intent, Domain, And Slot Knowledge Distillation for Multi-turn NLU

KOALA: Enhancing Speculative Decoding for LLM via Multi-Layer Draft Heads with Adversarial Learning

P/D-Serve: Serving Disaggregated Large Language Model at Scale

Large Language Models are Few-Shot Training Example Generators: A Case Study in Fallacy Recognition

Covert Bias: The Severity of Social Views’ Unalignment Towards Implicit and Explicit Opinion

Quantifying Memorization and Detecting Training Data of Pre-trained Language Models using Japanese Newspaper

mhGPT: A Lightweight Generative Pre-Trained Transformer for Mental Health Text Analysis

最近の投稿

最近のコメント

アーカイブ

カテゴリー