cs.SD」カテゴリーアーカイブ

Representation Learning for Audio Privacy Preservation using Source Separation and Robust Adversarial Learning

要約 プライバシーの保護は、システムの動作環境でターゲット信号とともに音声を受動 … 続きを読む

カテゴリー: cs.CR, cs.LG, cs.SD, eess.AS | Representation Learning for Audio Privacy Preservation using Source Separation and Robust Adversarial Learning はコメントを受け付けていません

Transferable Models for Bioacoustics with Human Language Supervision

要約 パッシブ音響モニタリングは、地球規模の生物多様性と種に対する人為的影響を追 … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS, q-bio.QM | Transferable Models for Bioacoustics with Human Language Supervision はコメントを受け付けていません

Unsupervised Out-of-Distribution Dialect Detection with Mahalanobis Distance

要約 方言分類は、システム全体のパフォーマンスを向上させるために、機械翻訳や音声 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.SD, eess.AS | Unsupervised Out-of-Distribution Dialect Detection with Mahalanobis Distance はコメントを受け付けていません

Induction Network: Audio-Visual Modality Gap-Bridging for Self-Supervised Sound Source Localization

要約 自己教師による音源定位は、通常、モダリティの不一致によって困難になります。 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM, cs.SD, eess.AS | Induction Network: Audio-Visual Modality Gap-Bridging for Self-Supervised Sound Source Localization はコメントを受け付けていません

Separate Anything You Describe

要約 Language-Queryed Audio Source Separat … 続きを読む

カテゴリー: cs.AI, cs.MM, cs.SD, eess.AS | Separate Anything You Describe はコメントを受け付けていません

Advancing Natural-Language Based Audio Retrieval with PaSST and Large Audio-Caption Data Sets

要約 この研究では、事前トレーニングされたテキストとスペクトログラム変換器に基づ … 続きを読む

カテゴリー: cs.IR, cs.LG, cs.SD, eess.AS | Advancing Natural-Language Based Audio Retrieval with PaSST and Large Audio-Caption Data Sets はコメントを受け付けていません

Universal Automatic Phonetic Transcription into the International Phonetic Alphabet

要約 この論文では、あらゆる言語の音声を国際音声文字 (IPA) に転写するため … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Universal Automatic Phonetic Transcription into the International Phonetic Alphabet はコメントを受け付けていません

Federated Representation Learning for Automatic Speech Recognition

要約 Federated Learning (FL) はプライバシーを保護するパ … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | Federated Representation Learning for Automatic Speech Recognition はコメントを受け付けていません

GEmo-CLAP: Gender-Attribute-Enhanced Contrastive Language-Audio Pretraining for Speech Emotion Recognition

要約 対照学習ベースのクロスモダリティ事前トレーニング アプローチは、最近、さま … 続きを読む

カテゴリー: cs.CL, cs.MM, cs.SD, eess.AS | GEmo-CLAP: Gender-Attribute-Enhanced Contrastive Language-Audio Pretraining for Speech Emotion Recognition はコメントを受け付けていません

Speech Separation based on Contrastive Learning and Deep Modularization

要約 現在のモノラルの最先端の音声分離ツールは教師あり学習に依存しています。 こ … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Speech Separation based on Contrastive Learning and Deep Modularization はコメントを受け付けていません