eess.AS」カテゴリーアーカイブ

Ichigo: Mixed-Modal Early-Fusion Realtime Voice Assistant

要約 大規模言語モデル(LLM)は自然言語処理に革命をもたらしたが、音声とテキス … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Ichigo: Mixed-Modal Early-Fusion Realtime Voice Assistant はコメントを受け付けていません

LinTO Audio and Textual Datasets to Train and Evaluate Automatic Speech Recognition in Tunisian Arabic Dialect

要約 チュニジアのアラビア方言の自動音声認識(ASR)システムの開発は、方言の言 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | LinTO Audio and Textual Datasets to Train and Evaluate Automatic Speech Recognition in Tunisian Arabic Dialect はコメントを受け付けていません

Deep learning for music generation. Four approaches and their comparative evaluation

要約 本稿では、音楽生成のための4つの異なる人工知能アルゴリズムを紹介し、生成さ … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | Deep learning for music generation. Four approaches and their comparative evaluation はコメントを受け付けていません

AIM: Acoustic Inertial Measurement for Indoor Drone Localization and Tracking

要約 屋内ドローンのローカリゼーションと追跡のためのユニークな技術である音響慣性 … 続きを読む

カテゴリー: cs.RO, cs.SD, eess.AS | AIM: Acoustic Inertial Measurement for Indoor Drone Localization and Tracking はコメントを受け付けていません

Chain of Correction for Full-text Speech Recognition with Large Language Models

要約 自動音声認識(ASR)のための大規模な言語モデル(LLMS)とのフルテキス … 続きを読む

カテゴリー: cs.CL, eess.AS | Chain of Correction for Full-text Speech Recognition with Large Language Models はコメントを受け付けていません

Medical Spoken Named Entity Recognition

要約 話された名前の名前のエンティティ認識(NER)は、スピーチから名前のエンテ … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | Medical Spoken Named Entity Recognition はコメントを受け付けていません

Large Language Model Can Transcribe Speech in Multi-Talker Scenarios with Versatile Instructions

要約 大規模な言語モデル(LLM)の最近の進歩は、さまざまなドメインに革命をもた … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | Large Language Model Can Transcribe Speech in Multi-Talker Scenarios with Versatile Instructions はコメントを受け付けていません

Leveraging Embedding Techniques in Multimodal Machine Learning for Mental Illness Assessment

要約 うつ病やPTSDなどの精神障害の世界的な有病率の増加には、客観的でスケーラ … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.AS | Leveraging Embedding Techniques in Multimodal Machine Learning for Mental Illness Assessment はコメントを受け付けていません

Enabling Auditory Large Language Models for Automatic Speech Quality Evaluation

要約 音声品質評価では、通常、平均意見スコア(MOS)やスピーカーの類似性(SI … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Enabling Auditory Large Language Models for Automatic Speech Quality Evaluation はコメントを受け付けていません

QualiSpeech: A Speech Quality Assessment Dataset with Natural Language Reasoning and Descriptions

要約 このペーパーでは、自然言語の説明を活用することにより、音声品質評価に対する … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | QualiSpeech: A Speech Quality Assessment Dataset with Natural Language Reasoning and Descriptions はコメントを受け付けていません