月別アーカイブ: 2024年9月

EffiQA: Efficient Question-Answering with Strategic Multi-Model Collaboration on Knowledge Graphs

要約 大規模言語モデル (LLM) は自然言語処理において顕著な能力を示していま … 続きを読む

カテゴリー: cs.CL | EffiQA: Efficient Question-Answering with Strategic Multi-Model Collaboration on Knowledge Graphs はコメントを受け付けていません

Do LLMs Know When to NOT Answer? Investigating Abstention Abilities of Large Language Models

要約 棄権能力 (AA) は、大規模言語モデル (LLM) の信頼性の重要な側面 … 続きを読む

カテゴリー: cs.CL | Do LLMs Know When to NOT Answer? Investigating Abstention Abilities of Large Language Models はコメントを受け付けていません

Mixture of Tokens: Continuous MoE through Cross-Example Aggregation

要約 Transformer アーキテクチャに基づく Mixture of Ex … 続きを読む

カテゴリー: cs.CL, cs.LG | Mixture of Tokens: Continuous MoE through Cross-Example Aggregation はコメントを受け付けていません

Nine-year-old children outperformed ChatGPT in emotion: Evidence from Chinese writing

要約 ChatGPT は、人間のような複雑なテキストを生成する優れた能力を備えて … 続きを読む

カテゴリー: cs.CL | Nine-year-old children outperformed ChatGPT in emotion: Evidence from Chinese writing はコメントを受け付けていません

Controlling Risk of Retrieval-augmented Generation: A Counterfactual Prompting Framework

要約 検索拡張生成 (RAG) は、大規模な言語モデルの幻覚問題を軽減する一般的 … 続きを読む

カテゴリー: cs.CL | Controlling Risk of Retrieval-augmented Generation: A Counterfactual Prompting Framework はコメントを受け付けていません

Learn and Don’t Forget: Adding a New Language to ASR Foundation Models

要約 Foundation ASR モデルは多くの場合、多くの言語をサポートしま … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | Learn and Don’t Forget: Adding a New Language to ASR Foundation Models はコメントを受け付けていません

HelloBench: Evaluating Long Text Generation Capabilities of Large Language Models

要約 近年、大規模言語モデル (LLM) はさまざまなタスク (長い文脈の理解な … 続きを読む

カテゴリー: cs.CL | HelloBench: Evaluating Long Text Generation Capabilities of Large Language Models はコメントを受け付けていません

MINERS: Multilingual Language Models as Semantic Retrievers

要約 単語は、意味上の類似性をエンコードする高次元ベクトル空間で表現され、同義語 … 続きを読む

カテゴリー: cs.CL | MINERS: Multilingual Language Models as Semantic Retrievers はコメントを受け付けていません

DuQuant: Distributing Outliers via Dual Transformation Makes Stronger Quantized LLMs

要約 大規模言語モデル (LLM) の量子化は、特に効率的な低ビット表現を妨げる … 続きを読む

カテゴリー: cs.CL | DuQuant: Distributing Outliers via Dual Transformation Makes Stronger Quantized LLMs はコメントを受け付けていません

EuroLLM: Multilingual Language Models for Europe

要約 無差別 LLM の品質は大幅に向上していますが、依然として主に英語に重点を … 続きを読む

カテゴリー: cs.CL | EuroLLM: Multilingual Language Models for Europe はコメントを受け付けていません