月別アーカイブ: 2024年6月

AutoPureData: Automated Filtering of Web Data for LLM Fine-tuning

要約 最新で信頼性の高い大規模言語モデル (LLM) が常に求められています。 … 続きを読む

カテゴリー: cs.CL | AutoPureData: Automated Filtering of Web Data for LLM Fine-tuning はコメントを受け付けていません

AI Hospital: Benchmarking Large Language Models in a Multi-agent Medical Interaction Simulator

要約 人工知能は、特に医療質問応答ベンチマークで優れた大規模言語モデル (LLM … 続きを読む

カテゴリー: cs.CL | AI Hospital: Benchmarking Large Language Models in a Multi-agent Medical Interaction Simulator はコメントを受け付けていません

VERISCORE: Evaluating the factuality of verifiable claims in long-form text generation

要約 FACTSCORE (Min et al., 2023) や SAFE ( … 続きを読む

カテゴリー: cs.CL | VERISCORE: Evaluating the factuality of verifiable claims in long-form text generation はコメントを受け付けていません

CLERC: A Dataset for Legal Case Retrieval and Retrieval-Augmented Analysis Generation

要約 法律専門家は、関連する判例、つまり過去の判例の引用に基づいて分析を作成する … 続きを読む

カテゴリー: cs.CL, cs.CY | CLERC: A Dataset for Legal Case Retrieval and Retrieval-Augmented Analysis Generation はコメントを受け付けていません

MetaGPT: Merging Large Language Models Using Model Exclusive Task Arithmetic

要約 GPT-4 のような大規模言語モデル (LLM) の出現により、単一のモデ … 続きを読む

カテゴリー: cs.CL | MetaGPT: Merging Large Language Models Using Model Exclusive Task Arithmetic はコメントを受け付けていません

MuTox: Universal MUltilingual Audio-based TOXicity Dataset and Zero-shot Detector

要約 音声モダリティ(音声ベース)の自然言語処理における毒性検出の研究は、特に英 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS, I.2.7 | MuTox: Universal MUltilingual Audio-based TOXicity Dataset and Zero-shot Detector はコメントを受け付けていません

Thermometer: Towards Universal Calibration for Large Language Models

要約 大規模言語モデル (LLM) におけるキャリブレーションの問題を検討します … 続きを読む

カテゴリー: cs.CL, cs.LG, stat.ML | Thermometer: Towards Universal Calibration for Large Language Models はコメントを受け付けていません

The Odyssey of Commonsense Causality: From Foundational Benchmarks to Cutting-Edge Reasoning

要約 常識的な因果関係を理解することは、人間にとって特有の知性の証です。 これは … 続きを読む

カテゴリー: cs.CL | The Odyssey of Commonsense Causality: From Foundational Benchmarks to Cutting-Edge Reasoning はコメントを受け付けていません

DiVERT: Distractor Generation with Variational Errors Represented as Text for Math Multiple-choice Questions

要約 高品質の注意散漫要素は、多肢選択問題 (MCQ) の評価と教育的価値の両方 … 続きを読む

カテゴリー: cs.CL, cs.CY, cs.LG | DiVERT: Distractor Generation with Variational Errors Represented as Text for Math Multiple-choice Questions はコメントを受け付けていません

The Model Arena for Cross-lingual Sentiment Analysis: A Comparative Study in the Era of Large Language Models

要約 感情分析は、自然言語処理 (NLP) の重要なコンポーネントとして機能しま … 続きを読む

カテゴリー: cs.CL | The Model Arena for Cross-lingual Sentiment Analysis: A Comparative Study in the Era of Large Language Models はコメントを受け付けていません