要約
Riveter は、テキスト コーパス内のエンティティに関連付けられた動詞の含意を分析するための完全な使いやすいパイプラインを提供します。
パッケージには、感情、権力、主体性といった含意のフレームが事前に入力されており、ジェンダーバイアスなどの社会現象を幅広いコーパスで捉えるのに有用であることが実証されています。
何十年もの間、語彙フレームワークは計算社会科学、デジタル人文科学、自然言語処理の基礎的なツールであり、テキスト コーパスの多面的な分析を促進してきました。
しかし、動詞中心の語彙を扱うには特に自然言語処理スキルが必要となるため、他の研究者がアクセスしにくくなります。
Riveter は、言語処理パイプラインを整理し、コーパス内のすべてのエンティティの完全な語彙スコアと視覚化を提供し、ユーザーが特定の研究質問をターゲットにする機能を提供することにより、動詞語彙のアクセシビリティを大幅に向上させ、将来の幅広い研究を促進できます。
要約(オリジナル)
Riveter provides a complete easy-to-use pipeline for analyzing verb connotations associated with entities in text corpora. We prepopulate the package with connotation frames of sentiment, power, and agency, which have demonstrated usefulness for capturing social phenomena, such as gender bias, in a broad range of corpora. For decades, lexical frameworks have been foundational tools in computational social science, digital humanities, and natural language processing, facilitating multifaceted analysis of text corpora. But working with verb-centric lexica specifically requires natural language processing skills, reducing their accessibility to other researchers. By organizing the language processing pipeline, providing complete lexicon scores and visualizations for all entities in a corpus, and providing functionality for users to target specific research questions, Riveter greatly improves the accessibility of verb lexica and can facilitate a broad range of future research.
arxiv情報
著者 | Maria Antoniak,Anjalie Field,Jimin Mun,Melanie Walsh,Lauren F. Klein,Maarten Sap |
発行日 | 2023-12-15 05:03:24+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google