eess.AS」カテゴリーアーカイブ

Practical aspects for the creation of an audio dataset from field recordings with optimized labeling budget with AI-assisted strategy

要約 Machine Listening は、オーディオ信号から関連情報を抽出す … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | Practical aspects for the creation of an audio dataset from field recordings with optimized labeling budget with AI-assisted strategy はコメントを受け付けていません

Beat this! Accurate beat tracking without DBN postprocessing

要約 私たちは、多様な音楽範囲にわたる汎用性と高精度という 2 つの目的でビート … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | Beat this! Accurate beat tracking without DBN postprocessing はコメントを受け付けていません

Towards interfacing large language models with ASR systems using confidence measures and prompting

要約 大規模言語モデル (LLM) のパラメーター サイズとプロンプトによる対話 … 続きを読む

カテゴリー: cs.CL, eess.AS | Towards interfacing large language models with ASR systems using confidence measures and prompting はコメントを受け付けていません

On the Problem of Text-To-Speech Model Selection for Synthetic Data Generation in Automatic Speech Recognition

要約 ニューラル テキスト読み上げ (TTS) システムの急速な発展により、自動 … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | On the Problem of Text-To-Speech Model Selection for Synthetic Data Generation in Automatic Speech Recognition はコメントを受け付けていません

Generative Expressive Conversational Speech Synthesis

要約 会話型音声合成 (CSS) は、ユーザー エージェントの会話設定において、 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Generative Expressive Conversational Speech Synthesis はコメントを受け付けていません

Can LLMs ‘Reason’ in Music? An Evaluation of LLMs’ Capability of Music Understanding and Generation

要約 言語に似た記号音楽は、個別の記号でエンコードできます。 最近の研究では、G … 続きを読む

カテゴリー: cs.CL, cs.MM, cs.SD, eess.AS | Can LLMs ‘Reason’ in Music? An Evaluation of LLMs’ Capability of Music Understanding and Generation はコメントを受け付けていません

Towards Achieving Human Parity on End-to-end Simultaneous Speech Translation via LLM Agent

要約 この論文では、高品質で人間のような同時音声翻訳 (SiST) システムであ … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Towards Achieving Human Parity on End-to-end Simultaneous Speech Translation via LLM Agent はコメントを受け付けていません

Enhancing Partially Spoofed Audio Localization with Boundary-aware Attention Mechanism

要約 部分的にスプーフィングされたオーディオ位置特定のタスクは、フレーム レベル … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | Enhancing Partially Spoofed Audio Localization with Boundary-aware Attention Mechanism はコメントを受け付けていません

Between the AI and Me: Analysing Listeners’ Perspectives on AI- and Human-Composed Progressive Metal Music

要約 生成 AI モデルは最近開花し、芸術や音楽の伝統に大きな影響を与えています … 続きを読む

カテゴリー: cs.AI, cs.HC, cs.SD, eess.AS | Between the AI and Me: Analysing Listeners’ Perspectives on AI- and Human-Composed Progressive Metal Music はコメントを受け付けていません

ICAGC 2024: Inspirational and Convincing Audio Generation Challenge 2024

要約 Inspireal and Convincing Audio Genera … 続きを読む

カテゴリー: cs.AI, eess.AS | ICAGC 2024: Inspirational and Convincing Audio Generation Challenge 2024 はコメントを受け付けていません