要約
ある議論が最終的な判決に至るのはなぜか?口頭審理で審議されたのか、疑問視されたのか。公聴会の中で、特定の裁判官が反対意見を書くきっかけとなる何かがあったのだろうか?欧州人権裁判所(ECHR)の最終判決は入手可能であるにもかかわらず、ECHRの多言語口頭審理は文字起こしされておらず、構造化もされておらず、話者帰属もされていないため、現在のところ、これらの法的研究上の疑問には何一つ答えることができない。私たちは、この基本的なギャップを解決するために、英語、フランス語、その他の法廷言語による154の完全な公聴会(267時間以上のビデオ映像から210万トークン)から成る、ECHR初の口頭弁論テキストコーパスであるLaCour!動画から書き起こされ、部分的に手作業で修正されたテキストに加え、文レベルのタイムスタンプ、手作業で注釈が付けられた役割と言語のラベルが提供されています。また、質問と反対意見の間の相互作用を探求する一連の予備実験でLaCour!法律NLPでの使用例とは別に、https://huggingface.co/datasets/TrustHLT/LaCour、様々なフォーマットで自由に利用できるため、法学部の学生やその他の関係者が学習リソースとしてLaCour! を使用することも期待している。
要約(オリジナル)
Why does an argument end up in the final court decision? Was it deliberated or questioned during the oral hearings? Was there something in the hearings that triggered a particular judge to write a dissenting opinion? Despite the availability of the final judgments of the European Court of Human Rights (ECHR), none of these legal research questions can currently be answered as the ECHR’s multilingual oral hearings are not transcribed, structured, or speaker-attributed. We address this fundamental gap by presenting LaCour!, the first corpus of textual oral arguments of the ECHR, consisting of 154 full hearings (2.1 million tokens from over 267 hours of video footage) in English, French, and other court languages, each linked to the corresponding final judgment documents. In addition to the transcribed and partially manually corrected text from the video, we provide sentence-level timestamps and manually annotated role and language labels. We also showcase LaCour! in a set of preliminary experiments that explore the interplay between questions and dissenting opinions. Apart from the use cases in legal NLP, we hope that law students or other interested parties will also use LaCour! as a learning resource, as it is freely available in various formats at https://huggingface.co/datasets/TrustHLT/LaCour.
arxiv情報
著者 | Lena Held,Ivan Habernal |
発行日 | 2024-11-01 12:40:45+00:00 |
arxivサイト | arxiv_id(pdf) |