月別アーカイブ: 2025年1月

Benchmarking Uncertainty Quantification Methods for Large Language Models with LM-Polygraph

要約 大規模言語モデル (LLM) の急速な普及により、研究者は LLM 幻覚や … 続きを読む

カテゴリー: cs.CL, cs.LG | Benchmarking Uncertainty Quantification Methods for Large Language Models with LM-Polygraph はコメントを受け付けていません

ConSim: Measuring Concept-Based Explanations’ Effectiveness with Automated Simulatability

要約 概念ベースの説明は、複雑なモデルの計算を人間が理解できる概念にマッピングす … 続きを読む

カテゴリー: cs.CL | ConSim: Measuring Concept-Based Explanations’ Effectiveness with Automated Simulatability はコメントを受け付けていません

Paraphrase Types Elicit Prompt Engineering Capabilities

要約 最新の言語モデルの成功の多くは、モデルに指示するための適切なプロンプトを見 … 続きを読む

カテゴリー: cs.CL | Paraphrase Types Elicit Prompt Engineering Capabilities はコメントを受け付けていません

Navigating Tomorrow: Reliably Assessing Large Language Models Performance on Future Event Prediction

要約 将来のイベントを予測することは、複数の分野やドメインにわたるアプリケーショ … 続きを読む

カテゴリー: cs.CL, cs.IR | Navigating Tomorrow: Reliably Assessing Large Language Models Performance on Future Event Prediction はコメントを受け付けていません

LLMs Reproduce Stereotypes of Sexual and Gender Minorities

要約 多くの研究により、NLP システムにおける重大なジェンダーバイアスが判明し … 続きを読む

カテゴリー: cs.CL | LLMs Reproduce Stereotypes of Sexual and Gender Minorities はコメントを受け付けていません

Universal-2-TF: Robust All-Neural Text Formatting for ASR

要約 このペーパーでは、句読点復元 (PR)、トゥルーケーシング、および逆テキス … 続きを読む

カテゴリー: cs.CL, I.2.7 | Universal-2-TF: Robust All-Neural Text Formatting for ASR はコメントを受け付けていません

Can Many-Shot In-Context Learning Help LLMs as Evaluators? A Preliminary Empirical Study

要約 大規模言語モデル (LLM) のパフォーマンスを評価するための評価者として … 続きを読む

カテゴリー: cs.CL | Can Many-Shot In-Context Learning Help LLMs as Evaluators? A Preliminary Empirical Study はコメントを受け付けていません

Finnish SQuAD: A Simple Approach to Machine Translation of Span Annotations

要約 DeepL MT サービスとそのフォーマット済みドキュメントの翻訳機能を使 … 続きを読む

カテゴリー: cs.CL | Finnish SQuAD: A Simple Approach to Machine Translation of Span Annotations はコメントを受け付けていません

Towards Early Prediction of Self-Supervised Speech Model Performance

要約 自己教師あり学習 (SSL) では、事前トレーニングと評価にリソースが大量 … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | Towards Early Prediction of Self-Supervised Speech Model Performance はコメントを受け付けていません

Hermit Kingdom Through the Lens of Multiple Perspectives: A Case Study of LLM Hallucination on North Korea

要約 大規模言語モデル (LLM) における幻覚は、特に誤った情報を広める可能性 … 続きを読む

カテゴリー: cs.CL | Hermit Kingdom Through the Lens of Multiple Perspectives: A Case Study of LLM Hallucination on North Korea はコメントを受け付けていません