Data and Approaches for German Text simplification — towards an Accessibility-enhanced Communication

要約

この論文は、並列および単一言語のドイツ語コーパスに焦点を当てて、現在の最先端のドイツ語テキスト簡略化を検証します。
ドイツ語の文章を簡素化するためのニューラル言語モデルをレビューし、法的文章とアクセシビリティ要件への適合性を評価します。
私たちの調査結果は、追加のトレーニング データと、ドイツ語特有の言語特性を考慮したより適切なアプローチの必要性、および認知障害または言語障害を持つ対象グループのニーズと好みの重要性を強調しています。
著者らは、これらの研究ギャップに対処するために、2023 年 4 月に学際的な OPEN-LS プロジェクトを立ち上げました。
このプロジェクトは、読み書き能力の低い個人に合わせたテキスト形式のフレームワークを開発し、法律テキストを統合し、言語障害または認知障害を持つ人々の理解を高めることを目的としています。
また、画像生成 AI を使用して、視聴者固有のイラストでデータを強化する費用対効果の高い方法も検討します。
詳細および最新情報については、プロジェクトのホームページ https://open-ls.entavis.com をご覧ください。

要約(オリジナル)

This paper examines the current state-of-the-art of German text simplification, focusing on parallel and monolingual German corpora. It reviews neural language models for simplifying German texts and assesses their suitability for legal texts and accessibility requirements. Our findings highlight the need for additional training data and more appropriate approaches that consider the specific linguistic characteristics of German, as well as the importance of the needs and preferences of target groups with cognitive or language impairments. The authors launched the interdisciplinary OPEN-LS project in April 2023 to address these research gaps. The project aims to develop a framework for text formats tailored to individuals with low literacy levels, integrate legal texts, and enhance comprehensibility for those with linguistic or cognitive impairments. It will also explore cost-effective ways to enhance the data with audience-specific illustrations using image-generating AI. For more and up-to-date information, please visit our project homepage https://open-ls.entavis.com

arxiv情報

著者 Thorben Schomacker,Michael Gille,Jörg von der Hülls,Marina Tropmann-Frick
発行日 2023-12-15 17:23:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク