Exploring neural oscillations during speech perception via surrogate gradient spiking neural networks

要約

脳における認知プロセスを理解するには、大規模なスケールで神経ダイナミクスを再現できる高度なモデルが必要である。我々は、ディープラーニングフレームワークと互換性がありスケーラブルな、生理学的にインスパイアされた音声認識アーキテクチャを提示し、エンド・ツー・エンドの勾配降下トレーニングが、中央のスパイキングニューラルネットワークにおける神経振動の出現につながることを実証する。これらの振動を示す有意な交差周波数結合が、音声処理中のネットワーク層内および層間で測定された。さらに、我々の発見は、認識パフォーマンスを向上させるために神経活動を制御し同期させる上で、スパイク周波数順応やリカレント結合などのフィードバック機構が重要な抑制的役割を果たすことを浮き彫りにした。全体として、ヒトの聴覚経路で顕著に観察される同期現象の理解を深めるだけでなく、我々のアーキテクチャは、ニューロモルフィック技術に関連するダイナミックで効率的な情報処理を示す。

要約(オリジナル)

Understanding cognitive processes in the brain demands sophisticated models capable of replicating neural dynamics at large scales. We present a physiologically inspired speech recognition architecture, compatible and scalable with deep learning frameworks, and demonstrate that end-to-end gradient descent training leads to the emergence of neural oscillations in the central spiking neural network. Significant cross-frequency couplings, indicative of these oscillations, are measured within and across network layers during speech processing, whereas no such interactions are observed when handling background noise inputs. Furthermore, our findings highlight the crucial inhibitory role of feedback mechanisms, such as spike frequency adaptation and recurrent connections, in regulating and synchronising neural activity to improve recognition performance. Overall, on top of developing our understanding of synchronisation phenomena notably observed in the human auditory pathway, our architecture exhibits dynamic and efficient information processing, with relevance to neuromorphic technology.

arxiv情報

著者 Alexandre Bittar,Philip N. Garner
発行日 2024-09-02 16:20:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL, q-bio.NC パーマリンク