Multi-aspect Multilingual and Cross-lingual Parliamentary Speech Analysis


これらは、言語学や自然言語処理 (NLP) 研究だけでなく、政治科学や社会科学にとっても興味深いものです。
既存の研究では個々の議会を研究していましたが、私たちは高度な NLP 手法を 2017 年から 2020 年までの 6 つの国の議会 (ブルガリア、チェコ、フランス、スロベニア、スペイン、イギリス) の共​​同比較分析に適用しました。議事録に含まれる感情とセンチメントを分析します。
ParlaMint データセット コレクションからデータを取得し、発言者の年齢、性別、政治的指向がスピーチから検出できるかどうかを評価します。


Parliamentary and legislative debate transcripts provide informative insight into elected politicians’ opinions, positions, and policy preferences. They are interesting for political and social sciences as well as linguistics and natural language processing (NLP) research. While existing research studied individual parliaments, we apply advanced NLP methods to a joint and comparative analysis of six national parliaments (Bulgarian, Czech, French, Slovene, Spanish, and United Kingdom) between 2017 and 2020. We analyze emotions and sentiment in the transcripts from the ParlaMint dataset collection and assess if the age, gender, and political orientation of speakers can be detected from their speeches. The results show some commonalities and many surprising differences among the analyzed countries.


著者 Kristian Miok,Encarnacion Hidalgo-Tenorio,Petya Osenova,Miguel-Angel Benitez-Castro,Marko Robnik-Sikonja
発行日 2023-06-20 13:32:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CL パーマリンク