Identifying Self-Disclosures of Use, Misuse and Addiction in Community-based Social Media Posts

要約

過去 10 年間、米国では処方薬と違法オピオイドの過剰摂取 (https://www.cdc.gov/drugoverdose/epidemic/index.html) により 50 万人以上が死亡し、国家的な公衆衛生上の緊急事態となっています (USDHHS)
、2017)。
意図しないオピオイドの過剰摂取をより効果的に防止するために、医療従事者はリスクのある患者を効果的に特定できる堅牢でタイムリーなツールを必要としています。
Reddit などのコミュニティベースのソーシャル メディア プラットフォームでは、ユーザーが自己開示を行って、他の場合はデリケートな薬物関連の行動について話し合うことができ、オピオイド使用障害の指標として機能することがよくあります。
これに向けて、オピオイド使用の 6 つの異なる段階 (医療使用、誤用、依存症、回復、再発、不使用) にわたるさまざまなサブレディットからの 2,500 件のオピオイド関連投稿からなる適度なサイズのコーパスを紹介します。
すべての投稿に対して、スパンレベルの抽出的な説明に注釈を付け、注釈の品質とモデル開発の両方におけるそれらの役割を徹底的に研究します。
私たちは、教師あり、少数ショット、またはゼロショット設定でいくつかの最先端のモデルを評価します。
実験結果とエラー分析から、オピオイド使用障害の段階を特定することは非常に状況に応じた困難な作業であることが示されています。
しかし、モデリング中に説明を使用すると、分類の精度が大幅に向上し、オピオイド使用障害の連続研究など、一か八かの分野での有益な役割が実証されることがわかりました。
データセットは正式版として Github 上で研究用に公開される予定です。

要約(オリジナル)

In the last decade, the United States has lost more than 500,000 people from an overdose involving prescription and illicit opioids (https://www.cdc.gov/drugoverdose/epidemic/index.html) making it a national public health emergency (USDHHS, 2017). To more effectively prevent unintentional opioid overdoses, medical practitioners require robust and timely tools that can effectively identify at-risk patients. Community-based social media platforms such as Reddit allow self-disclosure for users to discuss otherwise sensitive drug-related behaviors, often acting as indicators for opioid use disorder. Towards this, we present a moderate size corpus of 2500 opioid-related posts from various subreddits spanning 6 different phases of opioid use: Medical Use, Misuse, Addiction, Recovery, Relapse, Not Using. For every post, we annotate span-level extractive explanations and crucially study their role both in annotation quality and model development. We evaluate several state-of-the-art models in a supervised, few-shot, or zero-shot setting. Experimental results and error analysis show that identifying the phases of opioid use disorder is highly contextual and challenging. However, we find that using explanations during modeling leads to a significant boost in classification accuracy demonstrating their beneficial role in a high-stakes domain such as studying the opioid use disorder continuum. The dataset will be made available for research on Github in the formal version.

arxiv情報

著者 Chenghao Yang,Tuhin Chakrabarty,Karli R Hochstatter,Melissa N Slavin,Nabila El-Bassel,Smaranda Muresan
発行日 2023-11-15 16:05:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク