Towards Grammatical Tagging for the Legal Language of Cybersecurity

要約

法律用語は、法律専門家が通常使用する言語であると理解でき、そのため、話し言葉でも書き言葉でも使用できます。
サイバーセキュリティに関する最近の法律は明らかに法的な文言を文書で使用しており、そのため典型的な豊富な事例とサブ事例、および一般的な詳細の豊富さによる解釈の複雑さはすべて引き継がれています。
この論文は、サイバーセキュリティの法的言語の本質的な解釈、つまりサイバーセキュリティに関する法的文書から重要な品詞 (POS) を抽出するという課題に直面しています。
この課題は、法的言語の POS タグ付けに関する当社の方法論によって克服されます。
自然言語処理 (NLP) 用の最先端のオープンソース ツールと、ツールの結果を検証するための手動分析を活用します。
その結果、方法論は自動化され、前処理ステップを少し調整するだけで、おそらくあらゆる法律言語に一般的になります。
これは、サイバーセキュリティに関する最も関連性の高い EU の法律、つまり NIS 2 指令に関して実証されており、このような関連文書の、重要ではあるが最初の構造化された解釈を生み出しています。
さらに、私たちの調査結果は、SpaCy や ClausIE などのツールが NIS 2 の法的文言を超えて限界に達していることを示しています。

要約(オリジナル)

Legal language can be understood as the language typically used by those engaged in the legal profession and, as such, it may come both in spoken or written form. Recent legislation on cybersecurity obviously uses legal language in writing, thus inheriting all its interpretative complications due to the typical abundance of cases and sub-cases as well as to the general richness in detail. This paper faces the challenge of the essential interpretation of the legal language of cybersecurity, namely of the extraction of the essential Parts of Speech (POS) from the legal documents concerning cybersecurity. The challenge is overcome by our methodology for POS tagging of legal language. It leverages state-of-the-art open-source tools for Natural Language Processing (NLP) as well as manual analysis to validate the outcomes of the tools. As a result, the methodology is automated and, arguably, general for any legal language following minor tailoring of the preprocessing step. It is demonstrated over the most relevant EU legislation on cybersecurity, namely on the NIS 2 directive, producing the first, albeit essential, structured interpretation of such a relevant document. Moreover, our findings indicate that tools such as SpaCy and ClausIE reach their limits over the legal language of the NIS 2.

arxiv情報

著者 Gianpietro Castiglione,Giampaolo Bella,Daniele Francesco Santamaria
発行日 2023-06-29 15:39:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.CY パーマリンク