A Legal Framework for Natural Language Processing Model Training in Portugal

要約

深層学習の最近の進歩により、それまで人間の知性に限定されていたインテリジェントなアクションを実行できる多くの計算システムの出現が促進されました。
人間の言語の特定の場合、これらの進歩により、明示的にプログラムしなくても一貫したテキストを生成できる ChatGPT のようなアプリケーションの導入が可能になりました。
代わりに、これらのモデルは大量のテキスト データを使用して、人間の言語の意味のある表現を学習します。
これらの進歩に関連して、これらのアプリケーションによる著作権およびデータプライバシーの侵害に関する懸念が浮上しています。
こうした懸念にもかかわらず、新しい自然言語処理アプリケーションの開発ペースは、新しい規制の導入を大幅に上回っていました。
現在、法律専門家とコンピュータ科学者との間のコミュニケーションの壁が、そのようなアプリケーションの開発中に多くの意図しない法的侵害を引き起こしています。
このペーパーでは、学際的なチームがこのコミュニケーションのギャップを埋め、日常的な NLP の一連のユースケースを提示するとともに、開発中に発生する可能性のあるポルトガルの法律に焦点を当てることで、より準拠したポルトガル語の NLP 研究を促進することを目的としています。

要約(オリジナル)

Recent advances in deep learning have promoted the advent of many computational systems capable of performing intelligent actions that, until then, were restricted to the human intellect. In the particular case of human languages, these advances allowed the introduction of applications like ChatGPT that are capable of generating coherent text without being explicitly programmed to do so. Instead, these models use large volumes of textual data to learn meaningful representations of human languages. Associated with these advances, concerns about copyright and data privacy infringements caused by these applications have emerged. Despite these concerns, the pace at which new natural language processing applications continued to be developed largely outperformed the introduction of new regulations. Today, communication barriers between legal experts and computer scientists motivate many unintentional legal infringements during the development of such applications. In this paper, a multidisciplinary team intends to bridge this communication gap and promote more compliant Portuguese NLP research by presenting a series of everyday NLP use cases, while highlighting the Portuguese legislation that may arise during its development.

arxiv情報

著者 Rúben Almeida,Evelin Amorim
発行日 2024-05-01 14:18:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 68T50, cs.CL, cs.ET, K.5.0 パーマリンク