要約
人間の言語処理に関する説明は、関連するが明言されていない世界の知識で理解を豊かにする暗黙の「状況モデル」を長年訴えてきました。
ここでは、因果的介入手法を最近のトランスフォーマー モデルに適用して、単一のコンテキスト キューがあいまいな代名詞の解釈を変える Winograd Schema Challenge (WSC) のパフォーマンスを分析します。
私たちは、代名詞が最終的に候補の名詞句のどれに注目するかをガイドするコンテキストワードからの情報を伝達する役割を担う注意ヘッドの比較的小さな回路を特定します。
次に、状況モデルが厳密に必要ではない、厳密に一致する「構文」制御でこの回路がどのように動作するかを比較します。
これらの分析は、代名詞の解決を導くために暗黙的な状況モデルが構築される際の明確な経路を示唆しています。
要約(オリジナル)
Accounts of human language processing have long appealed to implicit “situation models” that enrich comprehension with relevant but unstated world knowledge. Here, we apply causal intervention techniques to recent transformer models to analyze performance on the Winograd Schema Challenge (WSC), where a single context cue shifts interpretation of an ambiguous pronoun. We identify a relatively small circuit of attention heads that are responsible for propagating information from the context word that guides which of the candidate noun phrases the pronoun ultimately attends to. We then compare how this circuit behaves in a closely matched “syntactic” control where the situation model is not strictly necessary. These analyses suggest distinct pathways through which implicit situation models are constructed to guide pronoun resolution.
arxiv情報
著者 | Takateru Yamakoshi,James L. McClelland,Adele E. Goldberg,Robert D. Hawkins |
発行日 | 2023-06-07 13:17:04+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google