要約
無限インパルス応答フィルターは、オーディオ エフェクトやシンセサイザーなど、時間とともに変化する多くのオーディオ システムの重要な構成要素です。
ただし、再帰的な構造により、自動微分を使用したこれらのシステムのエンドツーエンドのトレーニングが妨げられます。
周波数サンプリングやフレームベースの処理などの非再帰的フィルター近似が提案され、以前の研究で広く使用されてきましたが、それらは元のシステムの勾配を正確に反映できません。
この問題は、時変全極フィルターを再表現してそれ自体を介して勾配を逆伝播させることでこの問題を軽減します。これにより、フィルターの実装は自動微分フレームワークの技術的制限に束縛されなくなります。
この実装は、効率的な勾配評価のために極を備えたフィルタを含む任意のオーディオ システム内で使用できます。
フェイザー、時変減算シンセサイザー、フィードフォワード コンプレッサーで現実世界のダイナミック オーディオ システムをモデル化するためのトレーニング効率と表現力を実証します。
https://christhetree.github.io/all_pole_filters/ でコードを利用可能にし、VST プラグインでトレーニングされたオーディオ エフェクトとシンセ モデルを提供します。
要約(オリジナル)
Infinite impulse response filters are an essential building block of many time-varying audio systems, such as audio effects and synthesisers. However, their recursive structure impedes end-to-end training of these systems using automatic differentiation. Although non-recursive filter approximations like frequency sampling and frame-based processing have been proposed and widely used in previous works, they cannot accurately reflect the gradient of the original system. We alleviate this difficulty by re-expressing a time-varying all-pole filter to backpropagate the gradients through itself, so the filter implementation is not bound to the technical limitations of automatic differentiation frameworks. This implementation can be employed within any audio system containing filters with poles for efficient gradient evaluation. We demonstrate its training efficiency and expressive capabilities for modelling real-world dynamic audio systems on a phaser, time-varying subtractive synthesiser, and feed-forward compressor. We make our code available and provide the trained audio effect and synth models in a VST plugin at https://christhetree.github.io/all_pole_filters/.
arxiv情報
著者 | Chin-Yun Yu,Christopher Mitcheltree,Alistair Carson,Stefan Bilbao,Joshua D. Reiss,György Fazekas |
発行日 | 2024-04-12 09:58:58+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google