「eess.AS」カテゴリーアーカイブ

LinTO Audio and Textual Datasets to Train and Evaluate Automatic Speech Recognition in Tunisian Arabic Dialect

投稿日: 2025年4月4日作成者: jarxiv

要約チュニジアのアラビア方言の自動音声認識（ASR）システムの開発は、方言の言 … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Deep learning for music generation. Four approaches and their comparative evaluation

投稿日: 2025年4月4日作成者: jarxiv

要約本稿では、音楽生成のための4つの異なる人工知能アルゴリズムを紹介し、生成さ … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS | コメントを受け付けていません

AIM: Acoustic Inertial Measurement for Indoor Drone Localization and Tracking

投稿日: 2025年4月3日作成者: jarxiv

要約屋内ドローンのローカリゼーションと追跡のためのユニークな技術である音響慣性 … 続きを読む →

カテゴリー: cs.RO, cs.SD, eess.AS | コメントを受け付けていません

Chain of Correction for Full-text Speech Recognition with Large Language Models

投稿日: 2025年4月3日作成者: jarxiv

要約自動音声認識（ASR）のための大規模な言語モデル（LLMS）とのフルテキス … 続きを読む →

カテゴリー: cs.CL, eess.AS | コメントを受け付けていません

Medical Spoken Named Entity Recognition

投稿日: 2025年4月3日作成者: jarxiv

要約話された名前の名前のエンティティ認識（NER）は、スピーチから名前のエンテ … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Large Language Model Can Transcribe Speech in Multi-Talker Scenarios with Versatile Instructions

投稿日: 2025年4月3日作成者: jarxiv

要約大規模な言語モデル（LLM）の最近の進歩は、さまざまなドメインに革命をもた … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Leveraging Embedding Techniques in Multimodal Machine Learning for Mental Illness Assessment

投稿日: 2025年4月3日作成者: jarxiv

要約うつ病やPTSDなどの精神障害の世界的な有病率の増加には、客観的でスケーラ … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.AS | コメントを受け付けていません

Enabling Auditory Large Language Models for Automatic Speech Quality Evaluation

投稿日: 2025年4月2日作成者: jarxiv

要約音声品質評価では、通常、平均意見スコア（MOS）やスピーカーの類似性（SI … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

QualiSpeech: A Speech Quality Assessment Dataset with Natural Language Reasoning and Descriptions

投稿日: 2025年4月2日作成者: jarxiv

要約このペーパーでは、自然言語の説明を活用することにより、音声品質評価に対する … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Continuous Speech Tokenizer in Text To Speech

投稿日: 2025年4月1日作成者: jarxiv

要約大規模な言語モデルの時代における言語と言語の融合は、大きな注目を集めていま … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

「eess.AS」カテゴリーアーカイブ

LinTO Audio and Textual Datasets to Train and Evaluate Automatic Speech Recognition in Tunisian Arabic Dialect

Deep learning for music generation. Four approaches and their comparative evaluation

AIM: Acoustic Inertial Measurement for Indoor Drone Localization and Tracking

Chain of Correction for Full-text Speech Recognition with Large Language Models

Medical Spoken Named Entity Recognition

Large Language Model Can Transcribe Speech in Multi-Talker Scenarios with Versatile Instructions

Leveraging Embedding Techniques in Multimodal Machine Learning for Mental Illness Assessment

Enabling Auditory Large Language Models for Automatic Speech Quality Evaluation

QualiSpeech: A Speech Quality Assessment Dataset with Natural Language Reasoning and Descriptions

Continuous Speech Tokenizer in Text To Speech

最近の投稿

最近のコメント

アーカイブ

カテゴリー