Room Transfer Function Reconstruction Using Complex-valued Neural Networks and Irregularly Distributed Microphones

要約

室内の複雑な音場を計算するために必要な室内伝達関数の再構築には、いくつかの重要な現実世界への応用があります。
ただし、現実的ではない数のマイクが必要になることがよくあります。
最近では、古典的な信号処理方法に加えて、室内の散在点における非常に限られた一連の測定値から開始して室内伝達関数を再構築するために、深層学習技術が適用されています。
この論文では、複素数値ニューラル ネットワークを使用して、不規則に配置された少数のマイクを使用して、最初の室内共鳴の周波数範囲で室内伝達関数を推定します。
私たちの知る限り、複素数値ニューラル ネットワークが室内伝達関数の推定に使用されたのはこれが初めてです。
考慮されているタスクに複素数値の最適化を適用する利点を分析するために、提案された手法を音場再構成のための最先端のカーネルベースの信号処理アプローチと比較し、提案された手法が関連する利点を示すことを示します。
位相精度と再構築された音場の全体的な品質。
情報提供の目的で、同様に構造化されたデータ駆動型アプローチとモデルを比較しますが、このアプローチでは音場の大きさのみを再構築するために実数値ニューラル ネットワークが適用されます。

要約(オリジナル)

Reconstructing the room transfer functions needed to calculate the complex sound field in a room has several impor- tant real-world applications. However, an unpractical number of microphones is often required. Recently, in addition to classical signal processing methods, deep learning techniques have been applied to reconstruct the room transfer function starting from a very limited set of measurements at scattered points in the room. In this paper, we employ complex-valued neural networks to estimate room transfer functions in the frequency range of the first room resonances, using a few irregularly distributed microphones. To the best of our knowledge, this is the first time that complex-valued neural networks are used to estimate room transfer functions. To analyze the benefits of applying complex- valued optimization to the considered task, we compare the proposed technique with a state-of-the-art kernel-based signal processing approach for sound field reconstruction, showing that the proposed technique exhibits relevant advantages in terms of phase accuracy and overall quality of the reconstructed sound field. For informative purposes, we also compare the model with a similarly-structured data-driven approach that, however, applies a real-valued neural network to reconstruct only the magnitude of the sound field.

arxiv情報

著者 Francesca Ronchini,Luca Comanducci,Mirco Pezzoli,Fabio Antonacci,Augusto Sarti
発行日 2024-03-26 16:57:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.SD, eess.AS, eess.SP パーマリンク