A Bionic Natural Language Parser Equivalent to a Pushdown Automaton

要約

Papadimitriou らによって提案された Assembly Calculus (AC) は、神経活動のシミュレーションを通じて高度な認知機能を再現することを目的としており、Mitropolsky らによって提案された自然言語パーサーなど、AC に基づくいくつかのアプリケーションが開発されています。
ただし、このパーサーには Kleene クロージャを処理する機能がないため、すべての通常言語を解析できず、Finite Automata (FA) よりも弱くなります。
この論文では、AC に基づく新しいバイオニック自然言語パーサー (BNLP) を提案し、RNN と短期記憶メカニズムに触発された 2 つの新しい生物学的に合理的な構造、リカレント回路とスタック回路を統合します。
オリジナルのパーサーとは対照的に、BNLP はすべての通常言語と Dyck 言語を完全に処理できます。
したがって、Chomsky-Sch \H{u}tzenberger の定理を活用すると、すべてのコンテキストフリー言語を解析できる BNLP を構築できます。
また、どの PDA に対しても、BNLP に対応するパーサー オートマトンを常に形成できることを正式に証明し、BNLP が PDA と同等の記述能力を備え、元のパーサーの欠陥に対処できることを保証します。

要約(オリジナル)

Assembly Calculus (AC), proposed by Papadimitriou et al., aims to reproduce advanced cognitive functions through simulating neural activities, with several applications based on AC having been developed, including a natural language parser proposed by Mitropolsky et al. However, this parser lacks the ability to handle Kleene closures, preventing it from parsing all regular languages and rendering it weaker than Finite Automata (FA). In this paper, we propose a new bionic natural language parser (BNLP) based on AC and integrates two new biologically rational structures, Recurrent Circuit and Stack Circuit which are inspired by RNN and short-term memory mechanism. In contrast to the original parser, the BNLP can fully handle all regular languages and Dyck languages. Therefore, leveraging the Chomsky-Sch \H{u}tzenberger theorem, the BNLP which can parse all Context-Free Languages can be constructed. We also formally prove that for any PDA, a Parser Automaton corresponding to BNLP can always be formed, ensuring that BNLP has a description ability equal to that of PDA and addressing the deficiencies of the original parser.

arxiv情報

著者 Zhenghao Wei,Kehua Lin,Jianlin Feng
発行日 2024-04-26 11:50:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.FL パーマリンク