月別アーカイブ: 2024年9月

EffiQA: Efficient Question-Answering with Strategic Multi-Model Collaboration on Knowledge Graphs

投稿日: 2024年9月26日作成者: jarxiv

要約大規模言語モデル (LLM) は自然言語処理において顕著な能力を示していま … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Do LLMs Know When to NOT Answer? Investigating Abstention Abilities of Large Language Models

投稿日: 2024年9月26日作成者: jarxiv

要約棄権能力 (AA) は、大規模言語モデル (LLM) の信頼性の重要な側面 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Mixture of Tokens: Continuous MoE through Cross-Example Aggregation

投稿日: 2024年9月26日作成者: jarxiv

要約 Transformer アーキテクチャに基づく Mixture of Ex … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Nine-year-old children outperformed ChatGPT in emotion: Evidence from Chinese writing

投稿日: 2024年9月26日作成者: jarxiv

要約 ChatGPT は、人間のような複雑なテキストを生成する優れた能力を備えて … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Controlling Risk of Retrieval-augmented Generation: A Counterfactual Prompting Framework

投稿日: 2024年9月26日作成者: jarxiv

要約検索拡張生成 (RAG) は、大規模な言語モデルの幻覚問題を軽減する一般的 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Learn and Don’t Forget: Adding a New Language to ASR Foundation Models

投稿日: 2024年9月26日作成者: jarxiv

要約 Foundation ASR モデルは多くの場合、多くの言語をサポートしま … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

HelloBench: Evaluating Long Text Generation Capabilities of Large Language Models

投稿日: 2024年9月26日作成者: jarxiv

要約近年、大規模言語モデル (LLM) はさまざまなタスク (長い文脈の理解な … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

MINERS: Multilingual Language Models as Semantic Retrievers

投稿日: 2024年9月26日作成者: jarxiv

要約単語は、意味上の類似性をエンコードする高次元ベクトル空間で表現され、同義語 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

DuQuant: Distributing Outliers via Dual Transformation Makes Stronger Quantized LLMs

投稿日: 2024年9月26日作成者: jarxiv

要約大規模言語モデル (LLM) の量子化は、特に効率的な低ビット表現を妨げる … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

EuroLLM: Multilingual Language Models for Europe

投稿日: 2024年9月26日作成者: jarxiv

要約無差別 LLM の品質は大幅に向上していますが、依然として主に英語に重点を … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

月別アーカイブ: 2024年9月

EffiQA: Efficient Question-Answering with Strategic Multi-Model Collaboration on Knowledge Graphs

Do LLMs Know When to NOT Answer? Investigating Abstention Abilities of Large Language Models

Mixture of Tokens: Continuous MoE through Cross-Example Aggregation

Nine-year-old children outperformed ChatGPT in emotion: Evidence from Chinese writing

Controlling Risk of Retrieval-augmented Generation: A Counterfactual Prompting Framework

Learn and Don’t Forget: Adding a New Language to ASR Foundation Models

HelloBench: Evaluating Long Text Generation Capabilities of Large Language Models

MINERS: Multilingual Language Models as Semantic Retrievers

DuQuant: Distributing Outliers via Dual Transformation Makes Stronger Quantized LLMs

EuroLLM: Multilingual Language Models for Europe

最近の投稿

最近のコメント

アーカイブ

カテゴリー