Language Resources in Spanish for Automatic Text Simplification across Domains

要約

この研究では、金融、医学、歴史研究の 3 つの分野におけるスペイン語テキストの自動簡略化のために開発された言語リソースとモデルについて説明します。
各ドメインでいくつかのコーパス、注釈と簡略化ガイドライン、専門用語と簡略化された医療用語の辞典、金融ドメインの共有タスクで使用されるデータセット、および 2 つの簡略化ツールを作成しました。
方法論、リソース、関連出版物は、Web サイト https://clara-nlp.uned.es/ で公開されています。

要約(オリジナル)

This work describes the language resources and models developed for automatic simplification of Spanish texts in three domains: Finance, Medicine and History studies. We created several corpora in each domain, annotation and simplification guidelines, a lexicon of technical and simplified medical terms, datasets used in shared tasks for the financial domain, and two simplification tools. The methodology, resources and companion publications are shared publicly on the web-site: https://clara-nlp.uned.es/.

arxiv情報

著者 Antonio Moreno-Sandoval,Leonardo Campillos-Llanos,Ana García-Serrano
発行日 2024-09-30 16:26:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク