月別アーカイブ: 2024年3月

CacheGen: Fast Context Loading for Language Model Applications via KV Cache Streaming

要約 大規模言語モデル (LLM) は複雑なタスクを引き受けるため、その入力は、 … 続きを読む

カテゴリー: cs.LG, cs.NI | CacheGen: Fast Context Loading for Language Model Applications via KV Cache Streaming はコメントを受け付けていません

Dial-insight: Fine-tuning Large Language Models with High-Quality Domain-Specific Data Preventing Capability Collapse

要約 大規模言語モデル (LLM) の有効性は、特に特殊なドメイン内の基礎となる … 続きを読む

カテゴリー: cs.CL | Dial-insight: Fine-tuning Large Language Models with High-Quality Domain-Specific Data Preventing Capability Collapse はコメントを受け付けていません

TaxoLLaMA: WordNet-based Model for Solving Multiple Lexical Sematic Tasks

要約 この論文では、LLaMA-2-7b モデルの例で WordNet から語彙 … 続きを読む

カテゴリー: cs.CL | TaxoLLaMA: WordNet-based Model for Solving Multiple Lexical Sematic Tasks はコメントを受け付けていません

Mixed-Distil-BERT: Code-mixed Language Modeling for Bangla, English, and Hindi

要約 自然言語処理の分野で最も人気のある下流タスクの 1 つはテキスト分類です。 … 続きを読む

カテゴリー: cs.CL | Mixed-Distil-BERT: Code-mixed Language Modeling for Bangla, English, and Hindi はコメントを受け付けていません

Retrieval augmented text-to-SQL generation for epidemiological question answering using electronic health records

要約 電子医療記録 (EHR) と請求データは、患者の健康状態と医療の利用状況を … 続きを読む

カテゴリー: cs.CL | Retrieval augmented text-to-SQL generation for epidemiological question answering using electronic health records はコメントを受け付けていません

DyVal: Dynamic Evaluation of Large Language Models for Reasoning Tasks

要約 大規模言語モデル (LLM) は、さまざまな評価ベンチマークで顕著なパフォ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | DyVal: Dynamic Evaluation of Large Language Models for Reasoning Tasks はコメントを受け付けていません

To Label or Not to Label: Hybrid Active Learning for Neural Machine Translation

要約 アクティブ ラーニング (AL) 技術は、アノテーション用にラベルのないデ … 続きを読む

カテゴリー: cs.CL, cs.LG | To Label or Not to Label: Hybrid Active Learning for Neural Machine Translation はコメントを受け付けていません

Multi-Step Deductive Reasoning Over Natural Language: An Empirical Study on Out-of-Distribution Generalisation

要約 深層学習と記号論理推論を組み合わせることは、両方の分野の成功を活かすことを … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.LO | Multi-Step Deductive Reasoning Over Natural Language: An Empirical Study on Out-of-Distribution Generalisation はコメントを受け付けていません

Contextual Clarity: Generating Sentences with Transformer Models using Context-Reverso Data

要約 情報が豊富な時代では、状況に応じて関連性のある簡潔な情報をユーザーに提供す … 続きを読む

カテゴリー: cs.AI, cs.CL | Contextual Clarity: Generating Sentences with Transformer Models using Context-Reverso Data はコメントを受け付けていません

Should we be going MAD? A Look at Multi-Agent Debate Strategies for LLMs

要約 大規模言語モデル (LLM) の最近の進歩により、LLM がさまざまなドメ … 続きを読む

カテゴリー: cs.AI, cs.CL | Should we be going MAD? A Look at Multi-Agent Debate Strategies for LLMs はコメントを受け付けていません