EnrichEvent: Enriching Social Data with Contextual Information for Emerging Event Extraction

要約

ソーシャル プラットフォームは、情報を広めたり現実の社会的出来事について議論したりするための重要なプラットフォームとして台頭しており、研究者に新しいイベント検出フレームワークを設計および実装する優れた機会を提供しています。
ただし、既存のアプローチのほとんどは、キーワードのバースト性やネットワーク構造を利用して不特定のイベントを検出するだけです。
したがって、イベントや社会データの困難な性質に関して、未知のイベントを特定するための支援が必要になることがよくあります。
ツイートなどのソーシャル データは、スペルミス、不完全さ、語義の曖昧さ、不規則な言語、意見の側面のばらつきなどの特徴があります。
さらに、限られた構造知識を利用して、進化するイベントの識別的な特徴やパターンを抽出することは、ほとんど不可能です。
これらの課題に対処するために、この論文では、ストリーミング ソーシャル データの言語的および文脈的表現を活用する新しいフレームワーク、つまり EnrichEvent を提案します。
特に、文脈と言語の知識を活用して、意味的に関連するツイートを検出し、イベント検出アプローチの有効性を高めます。
最終的に、私たちが提案するフレームワークは、イベントごとにクラスター チェーンを生成し、時間の経過とともに進化するイベントの変化を示します。
私たちはフレームワークを評価するために広範な実験を実施し、不特定の社会的イベントの検出と区別におけるその高いパフォーマンスと有効性を検証しました。

要約(オリジナル)

Social platforms have emerged as crucial platforms for disseminating information and discussing real-life social events, offering researchers an excellent opportunity to design and implement novel event detection frameworks. However, most existing approaches only exploit keyword burstiness or network structures to detect unspecified events. Thus, they often need help identifying unknown events regarding the challenging nature of events and social data. Social data, e.g., tweets, is characterized by misspellings, incompleteness, word sense ambiguation, irregular language, and variation in aspects of opinions. Moreover, extracting discriminative features and patterns for evolving events by exploiting the limited structural knowledge is almost infeasible. To address these challenges, in this paper, we propose a novel framework, namely EnrichEvent, that leverages the linguistic and contextual representations of streaming social data. In particular, we leverage contextual and linguistic knowledge to detect semantically related tweets and enhance the effectiveness of the event detection approaches. Eventually, our proposed framework produces cluster chains for each event to show the evolving variation of the event through time. We conducted extensive experiments to evaluate our framework, validating its high performance and effectiveness in detecting and distinguishing unspecified social events.

arxiv情報

著者 Mohammadali Sefidi Esfahani,Mohammad Akbari
発行日 2024-11-27 15:19:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク