Automatic Annotation of Direct Speech in Written French Narratives

要約

書かれたテキストにおける直接音声の自動注釈 (AADS) は、計算による物語の理解によく使用されてきました。
ルールまたはディープ ニューラル ネットワークのいずれかに基づく方法が、特に英語またはドイツ語について研究されてきました。
しかし、私たちの目標言語であるフランス語に関しては、それほど多くの作品は存在しません。
私たちの目標は、フランス語で AADS モデルを設計および評価するための統一フレームワークを作成することです。
このために、単語ごとに DS の注釈が付けられた、これまでで最大のフランス語の物語データセットを統合しました。
配列ラベル付けまたは他の言語の AADS からのさまざまなベースラインを適応させました。
そして、一般化に焦点を当てた広範な評価を設計し、実施しました。
結果は、このタスクには依然として多大な努力が必要であること、および各ベースラインの特徴が強調されていることを示しています。
このフレームワークは改善される可能性がありますが、このテーマに関するさらなる研究を奨励するためにはさらに一歩前進です。

要約(オリジナル)

The automatic annotation of direct speech (AADS) in written text has been often used in computational narrative understanding. Methods based on either rules or deep neural networks have been explored, in particular for English or German languages. Yet, for French, our target language, not many works exist. Our goal is to create a unified framework to design and evaluate AADS models in French. For this, we consolidated the largest-to-date French narrative dataset annotated with DS per word; we adapted various baselines for sequence labelling or from AADS in other languages; and we designed and conducted an extensive evaluation focused on generalisation. Results show that the task still requires substantial efforts and emphasise characteristics of each baseline. Although this framework could be improved, it is a step further to encourage more research on the topic.

arxiv情報

著者 Noé Durandard,Viet-Anh Tran,Gaspard Michel,Elena V. Epure
発行日 2023-06-28 07:44:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク