Data-Driven Room Acoustic Modeling Via Differentiable Feedback Delay Networks With Learnable Delay Lines

要約

過去数十年にわたり、物理的環境の室内音響をエミュレートすることを目的とした人工残響アルゴリズムの設計に広範な研究が捧げられてきました。
大幅な進歩にもかかわらず、遅延ネットワーク モデルの自動パラメーター調整は未解決の課題のままです。
フィードバック遅延ネットワーク (FDN) のパラメータを見つけて、その出力が測定された室内インパルス応答のターゲット属性をレンダリングする新しい方法を紹介します。
提案されたアプローチには、トレーニング可能な遅延線を備えた微分可能な FDN の実装が含まれており、これにより、バックプロパゲーションを介してすべての遅延ネットワーク パラメーターを同時に学習できるようになります。
反復最適化プロセスは、エネルギー減衰とエコー密度を説明する微分可能な項を組み込んだ、知覚に基づく時間領域損失関数を最小限に抑えることを目指します。
実験的な検証を通じて、提案された方法が、所望の音響特性に厳密に一致できる時間不変の周波数に依存しない FDN を生成し、遺伝的アルゴリズムと分析的な FDN 設計に基づく既存の方法よりも優れていることを示します。

要約(オリジナル)

Over the past few decades, extensive research has been devoted to the design of artificial reverberation algorithms aimed at emulating the room acoustics of physical environments. Despite significant advancements, automatic parameter tuning of delay-network models remains an open challenge. We introduce a novel method for finding the parameters of a Feedback Delay Network (FDN) such that its output renders target attributes of a measured room impulse response. The proposed approach involves the implementation of a differentiable FDN with trainable delay lines, which, for the first time, allows us to simultaneously learn each and every delay-network parameter via backpropagation. The iterative optimization process seeks to minimize a perceptually-motivated time-domain loss function incorporating differentiable terms accounting for energy decay and echo density. Through experimental validation, we show that the proposed method yields time-invariant frequency-independent FDNs capable of closely matching the desired acoustical characteristics, and outperforms existing methods based on genetic algorithms and analytical FDN design.

arxiv情報

著者 Alessandro Ilic Mezza,Riccardo Giampiccolo,Enzo De Sena,Alberto Bernardini
発行日 2024-09-25 17:16:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.SD, eess.AS パーマリンク