From Lengthy to Lucid: A Systematic Literature Review on NLP Techniques for Taming Long Sentences

要約

長い文章は、読者が要点を把握したり、書き手の最初の意図を理解するのが難しくなるため、書面コミュニケーションにおいて長年にわたって根強い問題となってきました。
この調査は PRISMA ガイドラインを使用して実施され、長文の問題に対処するための 2 つの主な戦略、a) 文の圧縮と b) 文の分割を系統的にレビューしています。
2005 年以降、この分野への関心が高まる傾向が見られ、2017 年以降は大幅に増加しました。現在の研究は、文の圧縮と分割の両方について教師ありアプローチが主流です。
しかし、弱い自己監視技術にはかなりのギャップがあり、特にデータが限られている分野ではさらなる研究の機会があることが示唆されています。
この調査では、最も代表的な手法を包括的な分類に分類し、グループ化します。
また、一般的な文章圧縮とデータセットの分割について、これらの手法の比較評価分析も行います。
最後に、現在の方法の課題と限界について説明し、将来の研究の方向性への貴重な洞察を提供します。
この調査は、長文の複雑さに対処するための包括的なリソースとして機能することを目的としています。
私たちは、長文が効果的なコミュニケーションの障壁でなくなるまで、研究者がこの分野でさらなる進歩を遂げられるようにすることを目指しています。

要約(オリジナル)

Long sentences have been a persistent issue in written communication for many years since they make it challenging for readers to grasp the main points or follow the initial intention of the writer. This survey, conducted using the PRISMA guidelines, systematically reviews two main strategies for addressing the issue of long sentences: a) sentence compression and b) sentence splitting. An increased trend of interest in this area has been observed since 2005, with significant growth after 2017. Current research is dominated by supervised approaches for both sentence compression and splitting. Yet, there is a considerable gap in weakly and self-supervised techniques, suggesting an opportunity for further research, especially in domains with limited data. In this survey, we categorize and group the most representative methods into a comprehensive taxonomy. We also conduct a comparative evaluation analysis of these methods on common sentence compression and splitting datasets. Finally, we discuss the challenges and limitations of current methods, providing valuable insights for future research directions. This survey is meant to serve as a comprehensive resource for addressing the complexities of long sentences. We aim to enable researchers to make further advancements in the field until long sentences are no longer a barrier to effective communication.

arxiv情報

著者 Tatiana Passali,Efstathios Chatzikyriakidis,Stelios Andreadis,Thanos G. Stavropoulos,Anastasia Matonaki,Anestis Fachantidis,Grigorios Tsoumakas
発行日 2023-12-08 16:51:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク