月別アーカイブ: 2024年3月

CacheGen: Fast Context Loading for Language Model Applications via KV Cache Streaming

投稿日: 2024年3月15日作成者: jarxiv

要約大規模言語モデル (LLM) は複雑なタスクを引き受けるため、その入力は、 … 続きを読む →

カテゴリー: cs.LG, cs.NI | コメントを受け付けていません

Dial-insight: Fine-tuning Large Language Models with High-Quality Domain-Specific Data Preventing Capability Collapse

投稿日: 2024年3月15日作成者: jarxiv

要約大規模言語モデル (LLM) の有効性は、特に特殊なドメイン内の基礎となる … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

TaxoLLaMA: WordNet-based Model for Solving Multiple Lexical Sematic Tasks

投稿日: 2024年3月15日作成者: jarxiv

要約この論文では、LLaMA-2-7b モデルの例で WordNet から語彙 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Mixed-Distil-BERT: Code-mixed Language Modeling for Bangla, English, and Hindi

投稿日: 2024年3月15日作成者: jarxiv

要約自然言語処理の分野で最も人気のある下流タスクの 1 つはテキスト分類です。 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Retrieval augmented text-to-SQL generation for epidemiological question answering using electronic health records

投稿日: 2024年3月15日作成者: jarxiv

要約電子医療記録 (EHR) と請求データは、患者の健康状態と医療の利用状況を … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

DyVal: Dynamic Evaluation of Large Language Models for Reasoning Tasks

投稿日: 2024年3月15日作成者: jarxiv

要約大規模言語モデル (LLM) は、さまざまな評価ベンチマークで顕著なパフォ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

To Label or Not to Label: Hybrid Active Learning for Neural Machine Translation

投稿日: 2024年3月15日作成者: jarxiv

要約アクティブラーニング (AL) 技術は、アノテーション用にラベルのないデ … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Multi-Step Deductive Reasoning Over Natural Language: An Empirical Study on Out-of-Distribution Generalisation

投稿日: 2024年3月15日作成者: jarxiv

要約深層学習と記号論理推論を組み合わせることは、両方の分野の成功を活かすことを … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, cs.LO | コメントを受け付けていません

Contextual Clarity: Generating Sentences with Transformer Models using Context-Reverso Data

投稿日: 2024年3月15日作成者: jarxiv

要約情報が豊富な時代では、状況に応じて関連性のある簡潔な情報をユーザーに提供す … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Should we be going MAD? A Look at Multi-Agent Debate Strategies for LLMs

投稿日: 2024年3月15日作成者: jarxiv

要約大規模言語モデル (LLM) の最近の進歩により、LLM がさまざまなドメ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

月別アーカイブ: 2024年3月

CacheGen: Fast Context Loading for Language Model Applications via KV Cache Streaming

Dial-insight: Fine-tuning Large Language Models with High-Quality Domain-Specific Data Preventing Capability Collapse

TaxoLLaMA: WordNet-based Model for Solving Multiple Lexical Sematic Tasks

Mixed-Distil-BERT: Code-mixed Language Modeling for Bangla, English, and Hindi

Retrieval augmented text-to-SQL generation for epidemiological question answering using electronic health records

DyVal: Dynamic Evaluation of Large Language Models for Reasoning Tasks

To Label or Not to Label: Hybrid Active Learning for Neural Machine Translation

Multi-Step Deductive Reasoning Over Natural Language: An Empirical Study on Out-of-Distribution Generalisation

Contextual Clarity: Generating Sentences with Transformer Models using Context-Reverso Data

Should we be going MAD? A Look at Multi-Agent Debate Strategies for LLMs

最近の投稿

最近のコメント

アーカイブ

カテゴリー