月別アーカイブ: 2024年6月

LASER: Learning by Aligning Self-supervised Representations of Speech for Improving Content-related Tasks

要約 自己教師あり学習 (SSL) ベースの音声モデルは、フルスタックの音声処理 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | LASER: Learning by Aligning Self-supervised Representations of Speech for Improving Content-related Tasks はコメントを受け付けていません

Diffusion Gaussian Mixture Audio Denoise

要約 最近の拡散モデルは、オーディオのノイズ除去タスクにおいて有望なパフォーマン … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Diffusion Gaussian Mixture Audio Denoise はコメントを受け付けていません

DefAn: Definitive Answer Dataset for LLMs Hallucination Evaluation

要約 大規模言語モデル (LLM) は驚くべき機能を実証し、日常生活のアプリケー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | DefAn: Definitive Answer Dataset for LLMs Hallucination Evaluation はコメントを受け付けていません

Test of Time: A Benchmark for Evaluating LLMs on Temporal Reasoning

要約 大規模言語モデル (LLM) は、優れた推論能力を示していますが、特に複雑 … 続きを読む

カテゴリー: cs.CL | Test of Time: A Benchmark for Evaluating LLMs on Temporal Reasoning はコメントを受け付けていません

ReMI: A Dataset for Reasoning with Multiple Images

要約 大規模言語モデル (LLM) は継続的に進歩しているため、その拡張機能を効 … 続きを読む

カテゴリー: cs.CL, cs.CV | ReMI: A Dataset for Reasoning with Multiple Images はコメントを受け付けていません

Orthogonality and isotropy of speaker and phonetic information in self-supervised speech representations

要約 自己教師付き音声表現は、下流の音声技術に多大な利益をもたらしますが、それを … 続きを読む

カテゴリー: cs.CL | Orthogonality and isotropy of speaker and phonetic information in self-supervised speech representations はコメントを受け付けていません

Language Complexity and Speech Recognition Accuracy: Orthographic Complexity Hurts, Phonological Complexity Doesn’t

要約 どのような言語的要因が自動音声認識 (ASR) モデルのパフォーマンスに影 … 続きを読む

カテゴリー: cs.AI, cs.CL | Language Complexity and Speech Recognition Accuracy: Orthographic Complexity Hurts, Phonological Complexity Doesn’t はコメントを受け付けていません

MMMU: A Massive Multi-discipline Multimodal Understanding and Reasoning Benchmark for Expert AGI

要約 MMMU を紹介します。MMMU は、大学レベルの主題知識と慎重な推論を必 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | MMMU: A Massive Multi-discipline Multimodal Understanding and Reasoning Benchmark for Expert AGI はコメントを受け付けていません

ReadCtrl: Personalizing text generation with readability-controlled instruction learning

要約 ユーザーの読みやすさを条件にしたコンテンツ生成は、パーソナライゼーションの … 続きを読む

カテゴリー: cs.AI, cs.CL | ReadCtrl: Personalizing text generation with readability-controlled instruction learning はコメントを受け付けていません

Active Learning for Multilingual Fingerspelling Corpora

要約 私たちはアクティブ ラーニングを適用して、手話のデータ不足の問題を解決しま … 続きを読む

カテゴリー: cs.CL, cs.CV | Active Learning for Multilingual Fingerspelling Corpora はコメントを受け付けていません