要約
Instagram や Twitter などのソーシャル メディア プラットフォームは、麻薬マーケティングや違法販売の重要なチャネルとして浮上しています。
この問題に対処するには、オンラインでの違法薬物密売活動を検出し、ラベルを付けることが重要になります。
しかし、薬物密売の検出における従来の教師あり学習手法の有効性は、大量のラベル付きデータへのアクセスに大きく依存しており、データの注釈付けには時間とリソースが大量に消費されます。
さらに、これらのモデルは、麻薬売人が検出を避けるために欺瞞的な言葉や婉曲表現を使用する場合、密売活動を正確に特定するという課題に直面することがよくあります。
この制限を克服するために、私たちは、ChatGPT などの大規模言語モデル (LLM) を活用してソーシャル メディア上の違法薬物密売活動を検出することに関する初の体系的な研究を実施しました。
私たちは \emph{知識情報プロンプト} を作成するための分析フレームワークを提案します。これは、人間が対話し、LLM を使用して検出タスクを実行できるインターフェースとして機能します。
さらに、パフォーマンスと解釈可能性をさらに向上させるために、モンテカルロ ドロップアウト ベースのプロンプト最適化手法を設計します。
私たちの実験結果は、提案されたフレームワークが麻薬密売検出精度の点で他のベースライン言語モデルよりも優れており、12\% 近くという顕著な改善を示していることを示しています。
ChatGPT は、事前の知識と提案されたプロンプトを統合することで、麻薬売人が検出を回避するために使用する欺瞞的な言葉や婉曲表現が存在する場合でも、ソーシャル ネットワーク上の麻薬密売活動を効果的に特定し、ラベルを付けることができます。
私たちの研究の影響はソーシャル ネットワークにも広がり、オンライン セキュリティと公共の安全を向上させるために、事前の知識とシナリオベースのプロンプトを分析ツールに組み込むことの重要性が強調されています。
要約(オリジナル)
Social media platforms such as Instagram and Twitter have emerged as critical channels for drug marketing and illegal sale. Detecting and labeling online illicit drug trafficking activities becomes important in addressing this issue. However, the effectiveness of conventional supervised learning methods in detecting drug trafficking heavily relies on having access to substantial amounts of labeled data, while data annotation is time-consuming and resource-intensive. Furthermore, these models often face challenges in accurately identifying trafficking activities when drug dealers use deceptive language and euphemisms to avoid detection. To overcome this limitation, we conduct the first systematic study on leveraging large language models (LLMs), such as ChatGPT, to detect illicit drug trafficking activities on social media. We propose an analytical framework to compose \emph{knowledge-informed prompts}, which serve as the interface that humans can interact with and use LLMs to perform the detection task. Additionally, we design a Monte Carlo dropout based prompt optimization method to further to improve performance and interpretability. Our experimental findings demonstrate that the proposed framework outperforms other baseline language models in terms of drug trafficking detection accuracy, showing a remarkable improvement of nearly 12\%. By integrating prior knowledge and the proposed prompts, ChatGPT can effectively identify and label drug trafficking activities on social networks, even in the presence of deceptive language and euphemisms used by drug dealers to evade detection. The implications of our research extend to social networks, emphasizing the importance of incorporating prior knowledge and scenario-based prompts into analytical tools to improve online security and public safety.
arxiv情報
著者 | Chuanbo Hu,Bin Liu,Xin Li,Yanfang Ye |
発行日 | 2023-07-07 16:15:59+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google