cs.CL」カテゴリーアーカイブ

MM-MATH: Advancing Multimodal Math Evaluation with Process Evaluation and Fine-grained Classification

要約 大規模マルチモーダル モデル (LMM) におけるマルチモーダル数学推論の … 続きを読む

カテゴリー: cs.CL | MM-MATH: Advancing Multimodal Math Evaluation with Process Evaluation and Fine-grained Classification はコメントを受け付けていません

LLMs instead of Human Judges? A Large Scale Empirical Study across 20 NLP Evaluation Tasks

要約 人間の判断ではなく、LLM が生成した判断を使用して NLP モデルを評価 … 続きを読む

カテゴリー: cs.CL | LLMs instead of Human Judges? A Large Scale Empirical Study across 20 NLP Evaluation Tasks はコメントを受け付けていません

Math-LLaVA: Bootstrapping Mathematical Reasoning for Multimodal Large Language Models

要約 大規模言語モデル (LLM) は、特にテキストの数学的問題解決において、優 … 続きを読む

カテゴリー: cs.CL | Math-LLaVA: Bootstrapping Mathematical Reasoning for Multimodal Large Language Models はコメントを受け付けていません

WildGuard: Open One-Stop Moderation Tools for Safety Risks, Jailbreaks, and Refusals of LLMs

要約 WildGuard を紹介します。これは、(1) ユーザー プロンプト内の … 続きを読む

カテゴリー: cs.CL | WildGuard: Open One-Stop Moderation Tools for Safety Risks, Jailbreaks, and Refusals of LLMs はコメントを受け付けていません

Is In-Context Learning a Type of Gradient-Based Learning? Evidence from the Inverse Frequency Effect in Structural Priming

要約 大規模言語モデル (LLM) は、コンテキスト内学習 (ICL) の新たな … 続きを読む

カテゴリー: cs.CL | Is In-Context Learning a Type of Gradient-Based Learning? Evidence from the Inverse Frequency Effect in Structural Priming はコメントを受け付けていません

BASS: Batched Attention-optimized Speculative Sampling

要約 投機的デコードは、大規模な言語モデルをホストする際の待ち時間とスループット … 続きを読む

カテゴリー: cs.CL, cs.LG | BASS: Batched Attention-optimized Speculative Sampling はコメントを受け付けていません

WildTeaming at Scale: From In-the-Wild Jailbreaks to (Adversarially) Safer Language Models

要約 WildTeaming は、自動 LLM 安全レッドチーム フレームワーク … 続きを読む

カテゴリー: cs.CL | WildTeaming at Scale: From In-the-Wild Jailbreaks to (Adversarially) Safer Language Models はコメントを受け付けていません

‘Is ChatGPT a Better Explainer than My Professor?’: Evaluating the Explanation Capabilities of LLMs in Conversation Compared to a Human Baseline

要約 説明は知識共有の基礎を形成し、コミュニケーション原則、社会力学、学習理論に … 続きを読む

カテゴリー: cs.CL | ‘Is ChatGPT a Better Explainer than My Professor?’: Evaluating the Explanation Capabilities of LLMs in Conversation Compared to a Human Baseline はコメントを受け付けていません

PrExMe! Large Scale Prompt Exploration of Open Source LLMs for Machine Translation and Summarization Evaluation

要約 大規模言語モデル (LLM) は、NLP の分野に革命をもたらしました。 … 続きを読む

カテゴリー: cs.CL | PrExMe! Large Scale Prompt Exploration of Open Source LLMs for Machine Translation and Summarization Evaluation はコメントを受け付けていません

On the Impact of Voice Anonymization on Speech Diagnostic Applications: a Case Study on COVID-19 Detection

要約 深層学習の進歩に伴い、パーソナル アシスタント、感情コンピューティング、遠 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | On the Impact of Voice Anonymization on Speech Diagnostic Applications: a Case Study on COVID-19 Detection はコメントを受け付けていません