Ultra Low Complexity Deep Learning Based Noise Suppression


この論文では、リソースに制約のあるデバイス上でリアルタイムの音声強調を行う際に、ディープ ニューラル ネットワークの計算の複雑さを軽減する革新的な方法を紹介します。
提案されたアプローチは、畳み込み演算の計算負荷を軽減するためにチャネルごとの特徴の再配向を採用する 2 段階の処理フレームワークを利用します。
特に、当社のアルゴリズムは、従来の最先端のアプローチに比べて、計算の複雑さとメモリ使用量が 3 ~ 4 倍少ないことがわかります。


This paper introduces an innovative method for reducing the computational complexity of deep neural networks in real-time speech enhancement on resource-constrained devices. The proposed approach utilizes a two-stage processing framework, employing channelwise feature reorientation to reduce the computational load of convolutional operations. By combining this with a modified power law compression technique for enhanced perceptual quality, this approach achieves noise suppression performance comparable to state-of-the-art methods with significantly less computational requirements. Notably, our algorithm exhibits 3 to 4 times less computational complexity and memory usage than prior state-of-the-art approaches.


著者 Shrishti Saha Shetu,Soumitro Chakrabarty,Oliver Thiergart,Edwin Mabande
発行日 2023-12-13 13:34:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, eess.AS, eess.SP パーマリンク