「cs.CL」カテゴリーアーカイブ

Interactions Across Blocks in Post-Training Quantization of Large Language Models

投稿日: 2024年11月7日作成者: jarxiv

要約トレーニング後の量子化は、ニューラルネットワークの計算要求を軽減するため … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Evaluating Morphological Compositional Generalization in Large Language Models

投稿日: 2024年11月7日作成者: jarxiv

要約大規模言語モデル (LLM) は、さまざまな自然言語の生成および理解タスク … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

BABILong: Testing the Limits of LLMs with Long Context Reasoning-in-a-Haystack

投稿日: 2024年11月7日作成者: jarxiv

要約近年、大規模言語モデル (LLM) の入力コンテキストサイズが劇的に増加 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

What Really is Commonsense Knowledge?

投稿日: 2024年11月7日作成者: jarxiv

要約 Commonsense データセットは、主にクラウドソースによる人間による … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Improving Causal Reasoning in Large Language Models: A Survey

投稿日: 2024年11月7日作成者: jarxiv

要約因果推論 (CR) はインテリジェンスの重要な側面であり、問題解決、意 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Improving Context-Aware Preference Modeling for Language Models

投稿日: 2024年11月7日作成者: jarxiv

要約ペアごとの好みに基づいて言語モデルを微調整することは非常に効果的であること … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Pretraining and Updates of Domain-Specific LLM: A Case Study in the Japanese Business Domain

投稿日: 2024年11月7日作成者: jarxiv

要約さまざまな言語での大規模言語モデル (LLM) の開発が進んでいますが、英 … 続きを読む →

カテゴリー: 68T50, cs.AI, cs.CL, I.2 | コメントを受け付けていません

Counterfactual Token Generation in Large Language Models

投稿日: 2024年11月7日作成者: jarxiv

要約「もちろん、私は喜んであなたのために物語を作ります。ライラ船長は信頼できる … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

M3SciQA: A Multi-Modal Multi-Document Scientific QA Benchmark for Evaluating Foundation Models

投稿日: 2024年11月7日作成者: jarxiv

要約基礎モデルを評価するための既存のベンチマークは、主に単一ドキュメントのテキ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

OpenFactCheck: A Unified Framework for Factuality Evaluation of LLMs

投稿日: 2024年11月7日作成者: jarxiv

要約現実世界のさまざまなアプリケーションで大規模言語モデル (LLM) の使用 … 続きを読む →

カテゴリー: cs.AI, cs.CL, I.2.7 | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

Interactions Across Blocks in Post-Training Quantization of Large Language Models

Evaluating Morphological Compositional Generalization in Large Language Models

BABILong: Testing the Limits of LLMs with Long Context Reasoning-in-a-Haystack

What Really is Commonsense Knowledge?

Improving Causal Reasoning in Large Language Models: A Survey

Improving Context-Aware Preference Modeling for Language Models

Pretraining and Updates of Domain-Specific LLM: A Case Study in the Japanese Business Domain

Counterfactual Token Generation in Large Language Models

M3SciQA: A Multi-Modal Multi-Document Scientific QA Benchmark for Evaluating Foundation Models

OpenFactCheck: A Unified Framework for Factuality Evaluation of LLMs

最近の投稿

最近のコメント

アーカイブ

カテゴリー