Ultra Low Complexity Deep Learning Based Noise Suppression

要約

この論文では、リソースに制約のあるデバイス上でリアルタイムの音声強調を行う際に、ディープ ニューラル ネットワークの計算の複雑さを軽減する革新的な方法を紹介します。
提案されたアプローチは、畳み込み演算の計算負荷を軽減するためにチャネルごとの特徴の再配向を採用する 2 段階の処理フレームワークを利用します。
これを知覚品質を向上させる修正べき乗則圧縮技術と組み合わせることで、このアプローチは、大幅に少ない計算要件で最先端の方法に匹敵するノイズ抑制パフォーマンスを実現します。
特に、当社のアルゴリズムは、従来の最先端のアプローチに比べて、計算の複雑さとメモリ使用量が 3 ~ 4 倍少ないことがわかります。

要約(オリジナル)

This paper introduces an innovative method for reducing the computational complexity of deep neural networks in real-time speech enhancement on resource-constrained devices. The proposed approach utilizes a two-stage processing framework, employing channelwise feature reorientation to reduce the computational load of convolutional operations. By combining this with a modified power law compression technique for enhanced perceptual quality, this approach achieves noise suppression performance comparable to state-of-the-art methods with significantly less computational requirements. Notably, our algorithm exhibits 3 to 4 times less computational complexity and memory usage than prior state-of-the-art approaches.

arxiv情報

著者 Shrishti Saha Shetu,Soumitro Chakrabarty,Oliver Thiergart,Edwin Mabande
発行日 2023-12-13 13:34:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, eess.AS, eess.SP パーマリンク