要約
IsraParlTweet は、1992 年から 2023 年までの国会 (イスラエル議会) でのヘブライ語の議会議論と、2008 年から 2023 年までに国会議員によって作成された Twitter 投稿の新しいリンクされたコーパスであり、合計 2 億 9,450 万のヘブライ語が含まれています。
トークン。
生のテキストに加えて、コーパスには、講演者と国会セッションに関する包括的なメタデータ、およびいくつかの言語注釈が含まれています。
その結果、IsraParlTweet を使用して、さまざまな定量的および定性的分析を実施し、イスラエルの政治的議論に関する貴重な洞察を提供することができます。
要約(オリジナル)
We introduce IsraParlTweet, a new linked corpus of Hebrew-language parliamentary discussions from the Knesset (Israeli Parliament) between the years 1992-2023 and Twitter posts made by Members of the Knesset between the years 2008-2023, containing a total of 294.5 million Hebrew tokens. In addition to raw text, the corpus contains comprehensive metadata on speakers and Knesset sessions as well as several linguistic annotations. As a result, IsraParlTweet can be used to conduct a wide variety of quantitative and qualitative analyses and provide valuable insights into political discourse in Israel.
arxiv情報
著者 | Guy Mor-Lan,Effi Levi,Tamir Sheafer,Shaul R. Shenhav |
発行日 | 2024-05-30 17:21:15+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google