Representation Learning for Audio Privacy Preservation using Source Separation and Robust Adversarial Learning

要約

プライバシーの保護は、システムの動作環境でターゲット信号とともに音声を受動的に録音できるスマート音響モニタリング システムにおいて長年の懸案事項でした。
この研究では、プライバシー保護において一般的に使用される 2 つのアプローチ、つまりソース分離と敵対的表現学習の統合を提案します。
提案されたシステムは、音声録音の潜在的な表現を学習し、音声録音と非音声録音の区別を防ぎます。
最初に、ソース分離ネットワークはプライバシーに敏感なデータの一部をフィルタリングして除去し、敵対的な学習プロセス中に、システムはフィルタリングされた信号上でプライバシーを保護する表現を学習します。
ソース分離なし、敵対的学習なし、およびその両方なしのシステムと私たちの方法を比較することにより、提案した方法の有効性を実証します。
全体として、私たちの結果は、提案されたシステムが、音響モニタリングタスクで良好なパフォーマンスを維持しながら、音源分離または敵対的学習のみを使用するシステムと比較して、音声プライバシーの保護を大幅に向上できることを示唆しています。

要約(オリジナル)

Privacy preservation has long been a concern in smart acoustic monitoring systems, where speech can be passively recorded along with a target signal in the system’s operating environment. In this study, we propose the integration of two commonly used approaches in privacy preservation: source separation and adversarial representation learning. The proposed system learns the latent representation of audio recordings such that it prevents differentiating between speech and non-speech recordings. Initially, the source separation network filters out some of the privacy-sensitive data, and during the adversarial learning process, the system will learn privacy-preserving representation on the filtered signal. We demonstrate the effectiveness of our proposed method by comparing our method against systems without source separation, without adversarial learning, and without both. Overall, our results suggest that the proposed system can significantly improve speech privacy preservation compared to that of using source separation or adversarial learning solely while maintaining good performance in the acoustic monitoring task.

arxiv情報

著者 Diep Luong,Minh Tran,Shayan Gharib,Konstantinos Drossos,Tuomas Virtanen
発行日 2023-08-09 13:50:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CR, cs.LG, cs.SD, eess.AS パーマリンク