Segmentation en phrases : ouvrez les guillemets sans perdre le fil

要約

この論文では、XML 文書の文セグメント化のためのグラフ カスケードを示します。
私たちの提案は、引用符とハイフンで紹介される場合の文内の文を提供し、括弧で紹介される切り込みやコロンで紹介されるリストを含む場合にも特に注意を払っています。
このツールがどのように機能するかを示し、テスト コーパスでのシステムのパフォーマンスの評価とともに、同じデータセットで 2019 年に利用可能な結果と得られた結果を比較します。

要約(オリジナル)

This paper presents a graph cascade for sentence segmentation of XML documents. Our proposal offers sentences inside sentences for cases introduced by quotation marks and hyphens, and also pays particular attention to situations involving incises introduced by parentheses and lists introduced by colons. We present how the tool works and compare the results obtained with those available in 2019 on the same dataset, together with an evaluation of the system’s performance on a test corpus

arxiv情報

著者 Sandrine Ollinger,Denis Maurel
発行日 2024-07-29 09:02:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク