Extracting Incidents, Effects, and Requested Advice from MeToo Posts

要約

セクシャルハラスメントのサバイバーは、ソーシャルメディアで自分の経験を頻繁に共有し、感情や感情を明らかにし、アドバイスを求めています.
Reddit では、サバイバーが、(i) セクハラ事件、(ii) 感情や感情を含むサバイバーへの影響、(iii) 求められているアドバイスの組み合わせを説明する長い投稿を定期的に共有していることが観察されました。
このような投稿は MeToo 投稿と呼ばれますが、タグが付けられておらず、さまざまなサブレディットに表示される場合があります。
将来のヘルパー (カウンセラーやカジュアルな読者など) は、そのような投稿から生存者のニーズを理解する必要があります。
しかし、長い投稿は、読んだり返信したりするのに時間がかかる場合があります。
したがって、長い MeToo 投稿から重要な情報を抽出する問題に対処します。
上記の 3 つのカテゴリのいずれかを説明する投稿から文を識別するために、自然言語ベースのモデルを開発します。
データセットの 10 倍の交差検証で、モデルは 0.82 のマクロ F1 スコアを達成します。
さらに、Reddit の投稿から抽出された 8,947 のラベル付きの文章からなるデータセットである MeThree を提供しています。
MeThree に LIWC-22 ツールキットを適用して、3 つのカテゴリの文の異なる言語パターンが、感情のトーン、信頼性、およびその他の側面の違いをどのように明らかにできるかを理解します。

要約(オリジナル)

Survivors of sexual harassment frequently share their experiences on social media, revealing their feelings and emotions and seeking advice. We observed that on Reddit, survivors regularly share long posts that describe a combination of (i) a sexual harassment incident, (ii) its effect on the survivor, including their feelings and emotions, and (iii) the advice being sought. We term such posts MeToo posts, even though they may not be so tagged and may appear in diverse subreddits. A prospective helper (such as a counselor or even a casual reader) must understand a survivor’s needs from such posts. But long posts can be time-consuming to read and respond to. Accordingly, we address the problem of extracting key information from a long MeToo post. We develop a natural language-based model to identify sentences from a post that describe any of the above three categories. On ten-fold cross-validation of a dataset, our model achieves a macro F1 score of 0.82. In addition, we contribute MeThree, a dataset comprising 8,947 labeled sentences extracted from Reddit posts. We apply the LIWC-22 toolkit on MeThree to understand how different language patterns in sentences of the three categories can reveal differences in emotional tone, authenticity, and other aspects.

arxiv情報

著者 Vaibhav Garg,Jiaqing Yuan,Rujie Xi,Munindar P. Singh
発行日 2023-03-19 05:22:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク