要約
聴覚注意デコーディング (AAD) は、脳活動から話者候補の中から注目している話者を抽出することを目的としており、神経誘導型聴覚デバイスや脳とコンピュータのインターフェイスに有望なアプリケーションを提供します。
このパイロット研究は、信頼性の高いコード変調誘発電位を誘発するノイズタグ刺激プロトコルを使用した AAD への第一歩を踏み出しますが、聴覚モダリティでの検討は最小限に抑えられています。
参加者には、独自のバイナリ擬似ランダムノイズコードで振幅変調された 2 つのオランダ語音声刺激が順次提示され、これらに追加の解読可能な情報が効果的にタグ付けされました。
私たちは、変調されていないオーディオのデコードをさまざまな変調深度で変調されたオーディオと比較し、従来の AAD 方法とノイズ コードをデコードする標準的な方法を比較しました。
私たちのパイロットスタディでは、変調深度が 70 ~ 100% の従来の方法のほうが、変調されていないオーディオに比べてパフォーマンスが高いことが明らかになりました。
ノイズ コード デコーダでは、これらの結果はさらに改善されませんでした。
これらの基本的な洞察は、複数の話者が同時に話されている場合に、音声にノイズ コードを統合して聴覚的な話者検出を強化できる可能性を強調しています。
要約(オリジナル)
Auditory attention decoding (AAD) aims to extract from brain activity the attended speaker amidst candidate speakers, offering promising applications for neuro-steered hearing devices and brain-computer interfacing. This pilot study makes a first step towards AAD using the noise-tagging stimulus protocol, which evokes reliable code-modulated evoked potentials, but is minimally explored in the auditory modality. Participants were sequentially presented with two Dutch speech stimuli that were amplitude-modulated with a unique binary pseudo-random noise-code, effectively tagging these with additional decodable information. We compared the decoding of unmodulated audio against audio modulated with various modulation depths, and a conventional AAD method against a standard method to decode noise-codes. Our pilot study revealed higher performances for the conventional method with 70 to 100 percent modulation depths compared to unmodulated audio. The noise-code decoder did not further improve these results. These fundamental insights highlight the potential of integrating noise-codes in speech to enhance auditory speaker detection when multiple speakers are presented simultaneously.
arxiv情報
著者 | H. A. Scheppink,S. Ahmadi,P. Desain,M. Tangermann,J. Thielen |
発行日 | 2024-05-17 14:44:24+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google