Analyzing Toxicity in Deep Conversations: A Reddit Case Study

要約

オンライン ソーシャル メディアは、アクセスが簡単で他の人とつながることができるため、近年ますます人気が高まっています。
ソーシャル メディアの主な魅力の 1 つは匿名性であり、ユーザーは判断や報復を恐れることなく自分の考えや意見を共有できます。
この匿名性により、ソーシャル メディアは有害なコンテンツを含みやすくなっているため、責任ある生産的な使用を確保するには節度が必要です。
有害なコンテンツを検出するために、人工知能を使用したいくつかの方法が採用されています。
しかし、ヘイトスピーチの会話と文脈分析はまだ研究が進んでいません。
有望な作品のほとんどは、それをサポートする会話ではなく、一度に 1 つのテキストのみを分析します。
この研究では、ツリーベースのアプローチを採用して、公共の会話環境における有害性に関してユーザーがどのように行動するかを理解しています。
この目的を達成するために、私たちは冒涜を許容する 8 つの Reddit コミュニティから投稿と上位 100 件の投稿のコメント セクションの両方を収集し、合計 100 万件を超える回答を収集しています。
有害なコメントは、オンライン会話でその後有害なコメントが生成される可能性を高めることがわかりました。
私たちの分析では、元の投稿ではなく、直接のコンテキストが応答を形成する上で重要な役割を果たしていることも示しています。
また、合意に基づく冒涜の影響についても研究し、ユーザーの行動やパターンに関して、非合意に基づく冒涜との重複する類似点を観察しています。

要約(オリジナル)

Online social media has become increasingly popular in recent years due to its ease of access and ability to connect with others. One of social media’s main draws is its anonymity, allowing users to share their thoughts and opinions without fear of judgment or retribution. This anonymity has also made social media prone to harmful content, which requires moderation to ensure responsible and productive use. Several methods using artificial intelligence have been employed to detect harmful content. However, conversation and contextual analysis of hate speech are still understudied. Most promising works only analyze a single text at a time rather than the conversation supporting it. In this work, we employ a tree-based approach to understand how users behave concerning toxicity in public conversation settings. To this end, we collect both the posts and the comment sections of the top 100 posts from 8 Reddit communities that allow profanity, totaling over 1 million responses. We find that toxic comments increase the likelihood of subsequent toxic comments being produced in online conversations. Our analysis also shows that immediate context plays a vital role in shaping a response rather than the original post. We also study the effect of consensual profanity and observe overlapping similarities with non-consensual profanity in terms of user behavior and patterns.

arxiv情報

著者 Vigneshwaran Shankaran,Rajesh Sharma
発行日 2024-04-11 16:10:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.CY, cs.SI パーマリンク