cs.CL」カテゴリーアーカイブ

HELMET: How to Evaluate Long-Context Language Models Effectively and Thoroughly

要約 ロングコンテクスト言語モデル(LCLM)を評価するためのベンチマークは数多 … 続きを読む

カテゴリー: cs.AI, cs.CL | HELMET: How to Evaluate Long-Context Language Models Effectively and Thoroughly はコメントを受け付けていません

Lookback Lens: Detecting and Mitigating Contextual Hallucinations in Large Language Models Using Only Attention Maps

要約 ある文章を要約したり、質問に答えたりするよう求められると、大規模言語モデル … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Lookback Lens: Detecting and Mitigating Contextual Hallucinations in Large Language Models Using Only Attention Maps はコメントを受け付けていません

Selective Attention Improves Transformer

要約 注意のコンテキストにある不要な要素は、パフォーマンスを低下させる。我々は、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Selective Attention Improves Transformer はコメントを受け付けていません

LLMs Know More Than They Show: On the Intrinsic Representation of LLM Hallucinations

要約 大規模言語モデル(LLM)は、事実誤認、偏り、推論の失敗など、「幻覚」と総 … 続きを読む

カテゴリー: 68T50, cs.AI, cs.CL, I.2.7 | LLMs Know More Than They Show: On the Intrinsic Representation of LLM Hallucinations はコメントを受け付けていません

Domain-Specific Retrieval-Augmented Generation Using Vector Stores, Knowledge Graphs, and Tensor Factorization

要約 大規模言語モデル(LLM)は、大規模なコーパスで事前に学習され、質問応答( … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR, cs.SE | Domain-Specific Retrieval-Augmented Generation Using Vector Stores, Knowledge Graphs, and Tensor Factorization はコメントを受け付けていません

Large Language Models as Markov Chains

要約 大規模言語モデル(LLM)は、自然言語処理タスクの広い範囲において、またそ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, stat.ML | Large Language Models as Markov Chains はコメントを受け付けていません

Adaptive Inference-Time Compute: LLMs Can Predict if They Can Do Better, Even Mid-Generation

要約 推論時間計算は、大規模言語モデル(LLM)の性能を向上させるための強力なパ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Adaptive Inference-Time Compute: LLMs Can Predict if They Can Do Better, Even Mid-Generation はコメントを受け付けていません

Unified Multi-Modal Interleaved Document Representation for Information Retrieval

要約 情報検索(IR)手法は、与えられたクエリに応答する関連文書を特定することを … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR | Unified Multi-Modal Interleaved Document Representation for Information Retrieval はコメントを受け付けていません

Justice or Prejudice? Quantifying Biases in LLM-as-a-Judge

要約 LLM-as-a-Judgeは、様々なベンチマークにおける評価手法として広 … 続きを読む

カテゴリー: cs.AI, cs.CL | Justice or Prejudice? Quantifying Biases in LLM-as-a-Judge はコメントを受け付けていません

Salient Information Prompting to Steer Content in Prompt-based Abstractive Summarization

要約 大規模言語モデル(LLM)は、プロンプト技術を用いることで、領域横断的に流 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Salient Information Prompting to Steer Content in Prompt-based Abstractive Summarization はコメントを受け付けていません