cs.CL」カテゴリーアーカイブ

Chinese SimpleQA: A Chinese Factuality Evaluation for Large Language Models

要約 新しい LLM 評価ベンチマークは、大規模言語モデル (LLM) の急速な … 続きを読む

カテゴリー: cs.CL | Chinese SimpleQA: A Chinese Factuality Evaluation for Large Language Models はコメントを受け付けていません

Multi-Perspective Stance Detection

要約 主観的な NLP タスクは通常、複数のアノテーターによって提供される人間に … 続きを読む

カテゴリー: cs.CL | Multi-Perspective Stance Detection はコメントを受け付けていません

MILU: A Multi-task Indic Language Understanding Benchmark

要約 リソースが少なく言語的に多様な言語の大規模言語モデル (LLM) を評価す … 続きを読む

カテゴリー: cs.CL | MILU: A Multi-task Indic Language Understanding Benchmark はコメントを受け付けていません

CamemBERT 2.0: A Smarter French Language Model Aged to Perfection

要約 CamemBERT などのフランス語モデルは、自然言語処理 (NLP) タ … 続きを読む

カテゴリー: cs.CL | CamemBERT 2.0: A Smarter French Language Model Aged to Perfection はコメントを受け付けていません

Toxicity Detection is NOT all you Need: Measuring the Gaps to Supporting Volunteer Content Moderators

要約 コンテンツモデレーションの自動化アプローチにおける広範な取り組みは、モデレ … 続きを読む

カテゴリー: cs.AI, cs.CL | Toxicity Detection is NOT all you Need: Measuring the Gaps to Supporting Volunteer Content Moderators はコメントを受け付けていません

Separating Tongue from Thought: Activation Patching Reveals Language-Agnostic Concept Representations in Transformers

要約 多言語言語モデリングにおける中心的な問題は、大規模言語モデル (LLM) … 続きを読む

カテゴリー: cs.AI, cs.CL | Separating Tongue from Thought: Activation Patching Reveals Language-Agnostic Concept Representations in Transformers はコメントを受け付けていません

Uncertainty of Thoughts: Uncertainty-Aware Planning Enhances Information Seeking in Large Language Models

要約 不確実性に直面した場合、*情報を探す*能力は基本的に重要です。 医療診断や … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Uncertainty of Thoughts: Uncertainty-Aware Planning Enhances Information Seeking in Large Language Models はコメントを受け付けていません

Zero-shot Cross-lingual Transfer Learning with Multiple Source and Target Languages for Information Extraction: Language Selection and Adversarial Training

要約 多言語 IE に対処する以前の研究の大部分は、主にソース トレーニング デ … 続きを読む

カテゴリー: cs.AI, cs.CL | Zero-shot Cross-lingual Transfer Learning with Multiple Source and Target Languages for Information Extraction: Language Selection and Adversarial Training はコメントを受け付けていません

Can sparse autoencoders be used to decompose and interpret steering vectors?

要約 ステアリング ベクトルは、大規模な言語モデルの動作を制御するための有望なア … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Can sparse autoencoders be used to decompose and interpret steering vectors? はコメントを受け付けていません

The Limited Impact of Medical Adaptation of Large Language and Vision-Language Models

要約 最近のいくつかの研究では、医療アプリケーションに特化した基礎モデルの開発を … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | The Limited Impact of Medical Adaptation of Large Language and Vision-Language Models はコメントを受け付けていません