cs.SD」カテゴリーアーカイブ

An Efficient GPU-based Implementation for Noise Robust Sound Source Localization

要約 音源定位(SSL)、音源分離(SSS)、自動音声認識(ASR)を含むロボッ … 続きを読む

カテゴリー: cs.RO, cs.SD, eess.AS | An Efficient GPU-based Implementation for Noise Robust Sound Source Localization はコメントを受け付けていません

RWKVTTS: Yet another TTS based on RWKV-7

要約 人間とAIのインタラクションは、直感的で効率的なインターフェイスで繁栄して … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | RWKVTTS: Yet another TTS based on RWKV-7 はコメントを受け付けていません

Mind the Prompt: Prompting Strategies in Audio Generations for Improving Sound Classification

要約 本稿では、Text-To-Audio(TTA)モデルを用いて現実的なデータ … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS, eess.SP | Mind the Prompt: Prompting Strategies in Audio Generations for Improving Sound Classification はコメントを受け付けていません

Real-time Speech Summarization for Medical Conversations

要約 医師と患者の会話では、医療に関連する情報を特定することが重要であり、会話要 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS | Real-time Speech Summarization for Medical Conversations はコメントを受け付けていません

MultiMed-ST: Large-scale Many-to-many Multilingual Medical Speech Translation

要約 医療分野における多言語音声翻訳(ST)は、言語の壁を越えた効率的なコミュニ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS | MultiMed-ST: Large-scale Many-to-many Multilingual Medical Speech Translation はコメントを受け付けていません

Ichigo: Mixed-Modal Early-Fusion Realtime Voice Assistant

要約 大規模言語モデル(LLM)は自然言語処理に革命をもたらしたが、音声とテキス … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Ichigo: Mixed-Modal Early-Fusion Realtime Voice Assistant はコメントを受け付けていません

Ichigo: Mixed-Modal Early-Fusion Realtime Voice Assistant

要約 大規模言語モデル(LLM)は自然言語処理に革命をもたらしたが、音声とテキス … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Ichigo: Mixed-Modal Early-Fusion Realtime Voice Assistant はコメントを受け付けていません

LinTO Audio and Textual Datasets to Train and Evaluate Automatic Speech Recognition in Tunisian Arabic Dialect

要約 チュニジアのアラビア方言の自動音声認識(ASR)システムの開発は、方言の言 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | LinTO Audio and Textual Datasets to Train and Evaluate Automatic Speech Recognition in Tunisian Arabic Dialect はコメントを受け付けていません

Deep learning for music generation. Four approaches and their comparative evaluation

要約 本稿では、音楽生成のための4つの異なる人工知能アルゴリズムを紹介し、生成さ … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | Deep learning for music generation. Four approaches and their comparative evaluation はコメントを受け付けていません

AIM: Acoustic Inertial Measurement for Indoor Drone Localization and Tracking

要約 屋内ドローンのローカリゼーションと追跡のためのユニークな技術である音響慣性 … 続きを読む

カテゴリー: cs.RO, cs.SD, eess.AS | AIM: Acoustic Inertial Measurement for Indoor Drone Localization and Tracking はコメントを受け付けていません