A Neural-Symbolic Approach Towards Identifying Grammatically Correct Sentences

要約

私たちの周りのテキストコンテンツは日々増加しています。
私たちがオンライン新聞、ブログ、ソーシャル メディアで話している間に、数多くの記事が書かれています。
同様に、言語モデルや従来の古典的な AI アプローチなど、AI 分野における最近の進歩では、上記すべてを利用して学習された表現を改善し、人間のような正確さで NLP の課題に取り組んでいます。
テキストの要約、質問応答、機械翻訳、さらには代名詞の解決などの課題に取り組むには、有効なソースから適切に書かれたテキストにアクセスできることが重要であることが一般的に受け入れられています。
たとえば、うまく要約するには、最も重要な文を選択して、それらを連結して要約を形成する必要があります。
しかし、整形式の英語の文や無効な文にさえアクセスできない場合はどうなるでしょうか?
よく書かれた文章にアクセスすることの重要性にもかかわらず、それを検証する方法を見つけることはまだ未解決の研究領域です。
この問題に対処するために、新しい神経記号的アプローチを通じて英語の文章を検証する簡素化された方法を紹介します。
最近、ニューラルシンボリックアプローチは、さまざまな AI システムの中心コンポーネントとしての有効性を実証しているため、さまざまな NLP の課題への取り組みに対する関心が高まっています。
文法的ルールと構文ルールを言語モデルと融合させるクラシック AI とモダン AI を組み合わせることで、一連の単語が英語の文法的な文であるかどうかを示すタスクである言語受容性コーパス (COLA) に効果的に取り組みます。
とりわけ、行われた実験は、記号システムと非記号システムを混合すると、前者が後者の精度結果についての洞察を得るのに役立つことが効果的に示されています。

要約(オリジナル)

Textual content around us is growing on a daily basis. Numerous articles are being written as we speak on online newspapers, blogs, or social media. Similarly, recent advances in the AI field, like language models or traditional classic AI approaches, are utilizing all the above to improve their learned representation to tackle NLP challenges with human-like accuracy. It is commonly accepted that it is crucial to have access to well-written text from valid sources to tackle challenges like text summarization, question-answering, machine translation, or even pronoun resolution. For instance, to summarize well, one needs to select the most important sentences in order to concatenate them to form the summary. However, what happens if we do not have access to well-formed English sentences or even non-valid sentences? Despite the importance of having access to well-written sentences, figuring out ways to validate them is still an open area of research. To address this problem, we present a simplified way to validate English sentences through a novel neural-symbolic approach. Lately, neural-symbolic approaches have triggered an increasing interest towards tackling various NLP challenges, as they are demonstrating their effectiveness as a central component in various AI systems. Through combining Classic with Modern AI, which involves the blending of grammatical and syntactical rules with language models, we effectively tackle the Corpus of Linguistic Acceptability (COLA), a task that shows whether or not a sequence of words is an English grammatical sentence. Among others, undertaken experiments effectively show that blending symbolic and non-symbolic systems helps the former provide insights about the latter’s accuracy results.

arxiv情報

著者 Nicos Isaak
発行日 2023-07-16 13:21:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, I.2.0 パーマリンク