Renard: A Modular Pipeline for Extracting Character Networks from Narrative Texts

要約

Renard (NARrative ドキュメントからの関係抽出) は、ユーザーがカスタムの自然言語処理 (NLP) パイプラインを定義して、物語テキストから文字ネットワークを抽出できるようにする Python ライブラリです。
いくつかの既存のツールとは対照的に、Renard はより一般的な静的ネットワークだけでなく動的ネットワークも抽出できます。
Renard パイプラインはモジュール式です。ユーザーは、キャラクター ネットワークを抽出するために必要な各 NLP サブタスクの実装を選択できます。
これにより、ユーザーはパイプラインを特定の種類のテキストに特化し、抽出されたネットワークに対する各サブタスクの影響を調査できるようになります。

要約(オリジナル)

Renard (Relationships Extraction from NARrative Documents) is a Python library that allows users to define custom natural language processing (NLP) pipelines to extract character networks from narrative texts. Contrary to the few existing tools, Renard can extract dynamic networks, as well as the more common static networks. Renard pipelines are modular: users can choose the implementation of each NLP subtask needed to extract a character network. This allows users to specialize pipelines to particular types of texts and to study the impact of each subtask on the extracted network.

arxiv情報

著者 Arthur Amalvy,Vincent Labatut,Richard Dufour
発行日 2024-07-02 14:14:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク