要約
日常生活で記録された会話の分析にはプライバシーの保護が必要です。
この寄稿では、入力特徴の次元削減、スペクトル平滑化、およびマクアダムス係数に基づく低コストの話者匿名化技術に基づいた、プライバシーを保護する特徴抽出方法を検討します。
音声アクティビティ検出と話者ダイアライゼーション システムを使用して特徴抽出方法の有用性を評価し、プライバシー保護は音声認識と話者検証モデルを使用して判断します。
マクアダムス係数とスペクトル平滑化の組み合わせがプライバシーを向上させながら実用性を維持することを示します。
要約(オリジナル)
The analysis of conversations recorded in everyday life requires privacy protection. In this contribution, we explore a privacy-preserving feature extraction method based on input feature dimension reduction, spectral smoothing and the low-cost speaker anonymization technique based on McAdams coefficient. We assess the utility of the feature extraction methods with a voice activity detection and a speaker diarization system, while privacy protection is determined with a speech recognition and a speaker verification model. We show that the combination of McAdams coefficient and spectral smoothing maintains the utility while improving privacy.
arxiv情報
著者 | Francesco Nespoli,Jule Pohlhausen,Patrick A. Naylor,Joerg Bitzer |
発行日 | 2023-06-28 10:10:57+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google