Seeing through the Brain: Image Reconstruction of Visual Perception from Human Brain Signals

要約

しかし、百聞は一見に如かずですが、人間の視覚認識がどのように認知と絡み合っているかという根本的なメカニズムは依然として謎です。
神経科学と人工知能の両方における最近の進歩のおかげで、視覚的に引き起こされた脳活動を記録し、計算的アプローチを通じて視覚認識能力を模倣することが可能になりました。
本稿では、ポータブルにアクセス可能な脳信号、つまり脳波(EEG)データに基づいて観察画像を再構成することによる視覚刺激の再構成に注目します。
EEG 信号は時系列形式で動的であり、ノイズが多いことで知られているため、有用な情報を処理して抽出するには、より献身的な努力が必要です。
この論文では、EEG 信号から視覚刺激画像を再構成するための、NeuroImagen という名前の包括的なパイプラインを提案します。
具体的には、与えられたEEGデータからマルチグレイン出力を引き出すために、新しいマルチレベル知覚情報デコーディングを組み込みます。
潜在拡散モデルは、抽出された情報を活用して、高解像度の視覚刺激画像を再構築します。
実験結果は、画像再構成の有効性と、提案した方法の優れた定量的パフォーマンスを示しています。

要約(オリジナル)

Seeing is believing, however, the underlying mechanism of how human visual perceptions are intertwined with our cognitions is still a mystery. Thanks to the recent advances in both neuroscience and artificial intelligence, we have been able to record the visually evoked brain activities and mimic the visual perception ability through computational approaches. In this paper, we pay attention to visual stimuli reconstruction by reconstructing the observed images based on portably accessible brain signals, i.e., electroencephalography (EEG) data. Since EEG signals are dynamic in the time-series format and are notorious to be noisy, processing and extracting useful information requires more dedicated efforts; In this paper, we propose a comprehensive pipeline, named NeuroImagen, for reconstructing visual stimuli images from EEG signals. Specifically, we incorporate a novel multi-level perceptual information decoding to draw multi-grained outputs from the given EEG data. A latent diffusion model will then leverage the extracted information to reconstruct the high-resolution visual stimuli images. The experimental results have illustrated the effectiveness of image reconstruction and superior quantitative performance of our proposed method.

arxiv情報

著者 Yu-Ting Lan,Kan Ren,Yansen Wang,Wei-Long Zheng,Dongsheng Li,Bao-Liang Lu,Lili Qiu
発行日 2023-08-16 09:59:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.MM, eess.IV, q-bio.NC パーマリンク