cs.CL」カテゴリーアーカイブ

Interactions Across Blocks in Post-Training Quantization of Large Language Models

要約 トレーニング後の量子化は、ニューラル ネットワークの計算要求を軽減するため … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Interactions Across Blocks in Post-Training Quantization of Large Language Models はコメントを受け付けていません

Evaluating Morphological Compositional Generalization in Large Language Models

要約 大規模言語モデル (LLM) は、さまざまな自然言語の生成および理解タスク … 続きを読む

カテゴリー: cs.AI, cs.CL | Evaluating Morphological Compositional Generalization in Large Language Models はコメントを受け付けていません

BABILong: Testing the Limits of LLMs with Long Context Reasoning-in-a-Haystack

要約 近年、大規模言語モデル (LLM) の入力コンテキスト サイズが劇的に増加 … 続きを読む

カテゴリー: cs.AI, cs.CL | BABILong: Testing the Limits of LLMs with Long Context Reasoning-in-a-Haystack はコメントを受け付けていません

What Really is Commonsense Knowledge?

要約 Commonsense データセットは、主にクラウドソースによる人間による … 続きを読む

カテゴリー: cs.AI, cs.CL | What Really is Commonsense Knowledge? はコメントを受け付けていません

Improving Causal Reasoning in Large Language Models: A Survey

要約 因果推論 (CR) はインテリジェンスの重要な側面であり、問​​題解決、意 … 続きを読む

カテゴリー: cs.AI, cs.CL | Improving Causal Reasoning in Large Language Models: A Survey はコメントを受け付けていません

Improving Context-Aware Preference Modeling for Language Models

要約 ペアごとの好みに基づいて言語モデルを微調整することは非常に効果的であること … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Improving Context-Aware Preference Modeling for Language Models はコメントを受け付けていません

Pretraining and Updates of Domain-Specific LLM: A Case Study in the Japanese Business Domain

要約 さまざまな言語での大規模言語モデル (LLM) の開発が進んでいますが、英 … 続きを読む

カテゴリー: 68T50, cs.AI, cs.CL, I.2 | Pretraining and Updates of Domain-Specific LLM: A Case Study in the Japanese Business Domain はコメントを受け付けていません

Counterfactual Token Generation in Large Language Models

要約 「もちろん、私は喜んであなたのために物語を作ります。ライラ船長は信頼できる … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Counterfactual Token Generation in Large Language Models はコメントを受け付けていません

M3SciQA: A Multi-Modal Multi-Document Scientific QA Benchmark for Evaluating Foundation Models

要約 基礎モデルを評価するための既存のベンチマークは、主に単一ドキュメントのテキ … 続きを読む

カテゴリー: cs.AI, cs.CL | M3SciQA: A Multi-Modal Multi-Document Scientific QA Benchmark for Evaluating Foundation Models はコメントを受け付けていません

OpenFactCheck: A Unified Framework for Factuality Evaluation of LLMs

要約 現実世界のさまざまなアプリケーションで大規模言語モデル (LLM) の使用 … 続きを読む

カテゴリー: cs.AI, cs.CL, I.2.7 | OpenFactCheck: A Unified Framework for Factuality Evaluation of LLMs はコメントを受け付けていません