Modeling structure-building in the brain with CCG parsing and large language models

要約

タイトル:CCG parsingと大規模言語モデルを用いた脳の構造形成のモデリング

要約:
– 自然的な環境での言語理解の行動と神経的相関をモデル化するために、自然言語処理と機械学習に基づく幅広いカバレッジのツールを使って研究している。
– 構文構造が明示的にモデリングされる場合、これまでの研究は主に文脈自由文法(CFG)に依存してきたが、この形式は人間の言語には十分な表現力がない。
– 組み合わせカテゴリー文法(CCG)は、柔軟な構成要素を持ち、直接的な構文のモデルであり、増分的な解釈を提供することができる。本研究では、より表現力が高いCCGがCFGよりも優れたモデルを提供するかどうかを評価する。
– さらに、オプションの修飾子の扱いに違いがあるCCGのバリアントを比較して評価する。これらの評価は、Transformerニューラルネットワーク言語モデルからの次の単語の予測の推定値を含むベースラインに対して行われる。
– その比較により、CCG構造構築のユニークな貢献が左後頭葉で主に見られ、CCGから派生した測定値は、CFGから派生したものよりも神経信号への適合性が優れていることが明らかになった。
– これらの効果は予測性に固有の双側の上部頭形成効果とは空間的に異なり、自然な聴取中の構造形成の神経効果は、独立した言語的背景に基づく表現力の高い文法によって最もよく特徴づけられる。

要点:
– 自然言語処理と機械学習を使って自然的な環境での言語理解の行動と神経的相関をモデル化しようとする研究がある。
– より表現力の高い組み合わせカテゴリー文法(CCG)が文脈自由文法(CFG)よりも優れたモデルを提供するかどうかを評価する。
– CCGのバリアントの中でも、オプションの修飾子の扱いに違いがあるものを比較して評価する。
– CCG構造構築は、左後頭葉において、CFGに比べて神経信号への適合性が優れていることがわかった。
– 予測性に固有の双側の上部頭形成効果とは空間的に異なる構造形成の神経効果は、独立した言語的背景に基づく表現力の高い文法によって最もよく特徴づけられる。

要約(オリジナル)

To model behavioral and neural correlates of language comprehension in naturalistic environments researchers have turned to broad-coverage tools from natural-language processing and machine learning. Where syntactic structure is explicitly modeled, prior work has relied predominantly on context-free grammars (CFG), yet such formalisms are not sufficiently expressive for human languages. Combinatory Categorial Grammars (CCGs) are sufficiently expressive directly compositional models of grammar with flexible constituency that affords incremental interpretation. In this work we evaluate whether a more expressive CCG provides a better model than a CFG for human neural signals collected with fMRI while participants listen to an audiobook story. We further test between variants of CCG that differ in how they handle optional adjuncts. These evaluations are carried out against a baseline that includes estimates of next-word predictability from a Transformer neural network language model. Such a comparison reveals unique contributions of CCG structure-building predominantly in the left posterior temporal lobe: CCG-derived measures offer a superior fit to neural signals compared to those derived from a CFG. These effects are spatially distinct from bilateral superior temporal effects that are unique to predictability. Neural effects for structure-building are thus separable from predictability during naturalistic listening, and those effects are best characterized by a grammar whose expressive power is motivated on independent linguistic grounds.

arxiv情報

著者 Miloš Stanojević,Jonathan R. Brennan,Donald Dunagan,Mark Steedman,John T. Hale
発行日 2023-04-16 21:49:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL パーマリンク