月別アーカイブ: 2024年6月

AutoPureData: Automated Filtering of Web Data for LLM Fine-tuning

投稿日: 2024年6月28日作成者: jarxiv

要約最新で信頼性の高い大規模言語モデル (LLM) が常に求められています。 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

AI Hospital: Benchmarking Large Language Models in a Multi-agent Medical Interaction Simulator

投稿日: 2024年6月28日作成者: jarxiv

要約人工知能は、特に医療質問応答ベンチマークで優れた大規模言語モデル (LLM … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

VERISCORE: Evaluating the factuality of verifiable claims in long-form text generation

投稿日: 2024年6月28日作成者: jarxiv

要約 FACTSCORE (Min et al., 2023) や SAFE ( … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

CLERC: A Dataset for Legal Case Retrieval and Retrieval-Augmented Analysis Generation

投稿日: 2024年6月28日作成者: jarxiv

要約法律専門家は、関連する判例、つまり過去の判例の引用に基づいて分析を作成する … 続きを読む →

カテゴリー: cs.CL, cs.CY | コメントを受け付けていません

MetaGPT: Merging Large Language Models Using Model Exclusive Task Arithmetic

投稿日: 2024年6月28日作成者: jarxiv

要約 GPT-4 のような大規模言語モデル (LLM) の出現により、単一のモデ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

MuTox: Universal MUltilingual Audio-based TOXicity Dataset and Zero-shot Detector

投稿日: 2024年6月28日作成者: jarxiv

要約音声モダリティ（音声ベース）の自然言語処理における毒性検出の研究は、特に英 … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS, I.2.7 | コメントを受け付けていません

Thermometer: Towards Universal Calibration for Large Language Models

投稿日: 2024年6月28日作成者: jarxiv

要約大規模言語モデル (LLM) におけるキャリブレーションの問題を検討します … 続きを読む →

カテゴリー: cs.CL, cs.LG, stat.ML | コメントを受け付けていません

The Odyssey of Commonsense Causality: From Foundational Benchmarks to Cutting-Edge Reasoning

投稿日: 2024年6月28日作成者: jarxiv

要約常識的な因果関係を理解することは、人間にとって特有の知性の証です。これは … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

DiVERT: Distractor Generation with Variational Errors Represented as Text for Math Multiple-choice Questions

投稿日: 2024年6月28日作成者: jarxiv

要約高品質の注意散漫要素は、多肢選択問題 (MCQ) の評価と教育的価値の両方 … 続きを読む →

カテゴリー: cs.CL, cs.CY, cs.LG | コメントを受け付けていません

The Model Arena for Cross-lingual Sentiment Analysis: A Comparative Study in the Era of Large Language Models

投稿日: 2024年6月28日作成者: jarxiv

要約感情分析は、自然言語処理 (NLP) の重要なコンポーネントとして機能しま … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

月別アーカイブ: 2024年6月

AutoPureData: Automated Filtering of Web Data for LLM Fine-tuning

AI Hospital: Benchmarking Large Language Models in a Multi-agent Medical Interaction Simulator

VERISCORE: Evaluating the factuality of verifiable claims in long-form text generation

CLERC: A Dataset for Legal Case Retrieval and Retrieval-Augmented Analysis Generation

MetaGPT: Merging Large Language Models Using Model Exclusive Task Arithmetic

MuTox: Universal MUltilingual Audio-based TOXicity Dataset and Zero-shot Detector

Thermometer: Towards Universal Calibration for Large Language Models

The Odyssey of Commonsense Causality: From Foundational Benchmarks to Cutting-Edge Reasoning

DiVERT: Distractor Generation with Variational Errors Represented as Text for Math Multiple-choice Questions

The Model Arena for Cross-lingual Sentiment Analysis: A Comparative Study in the Era of Large Language Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー