eess.AS」カテゴリーアーカイブ

HLTCOE JHU Submission to the Voice Privacy Challenge 2024

要約 我々は、kNN-VC 法や WavLM 音声変換法などの音声変換ベースのシ … 続きを読む

カテゴリー: cs.LG, eess.AS | HLTCOE JHU Submission to the Voice Privacy Challenge 2024 はコメントを受け付けていません

Clean Label Attacks against SLU Systems

要約 ポイズニング バックドア攻撃では、攻撃者がトレーニング データを操作して、 … 続きを読む

カテゴリー: cs.CR, cs.LG, eess.AS | Clean Label Attacks against SLU Systems はコメントを受け付けていません

Biomimetic Frontend for Differentiable Audio Processing

要約 オーディオおよび音声処理のモデルはより深く、よりエンドツーエンドになってい … 続きを読む

カテゴリー: cs.LG, cs.NE, cs.SD, eess.AS | Biomimetic Frontend for Differentiable Audio Processing はコメントを受け付けていません

Large Language Model Can Transcribe Speech in Multi-Talker Scenarios with Versatile Instructions

要約 大規模言語モデル (LLM) の最近の進歩はさまざまな領域に革命をもたらし … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | Large Language Model Can Transcribe Speech in Multi-Talker Scenarios with Versatile Instructions はコメントを受け付けていません

LA-RAG:Enhancing LLM-based ASR Accuracy with Retrieval-Augmented Generation

要約 音声情報を大規模言語モデル (LLM) に統合する最近の進歩により、自動音 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | LA-RAG:Enhancing LLM-based ASR Accuracy with Retrieval-Augmented Generation はコメントを受け付けていません

Investigating Disentanglement in a Phoneme-level Speech Codec for Prosody Modeling

要約 音声韻律モデリングにおける一般的なアプローチのほとんどは、参照音声の属性を … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | Investigating Disentanglement in a Phoneme-level Speech Codec for Prosody Modeling はコメントを受け付けていません

NEST-RQ: Next Token Prediction for Speech Self-Supervised Pre-Training

要約 音声の自己監視型事前トレーニングは、下流のタスクのパフォーマンスを効果的に … 続きを読む

カテゴリー: cs.AI, cs.CL, eess.AS | NEST-RQ: Next Token Prediction for Speech Self-Supervised Pre-Training はコメントを受け付けていません

Exploring SSL Discrete Speech Features for Zipformer-based Contextual ASR

要約 自己教師あり学習 (SSL) ベースの離散音声表現は非常にコンパクトで、ド … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Exploring SSL Discrete Speech Features for Zipformer-based Contextual ASR はコメントを受け付けていません

Exploring SSL Discrete Tokens for Multilingual ASR

要約 音声関連タスクにおける自己教師あり学習 (SSL) の進歩に伴い、より高速 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Exploring SSL Discrete Tokens for Multilingual ASR はコメントを受け付けていません

Exploring the Impact of Data Quantity on ASR in Extremely Low-resource Languages

要約 この研究では、絶滅危惧種の 2 つのオーストロネシア語、アミ語とセデクに焦 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Exploring the Impact of Data Quantity on ASR in Extremely Low-resource Languages はコメントを受け付けていません