EnrichEvent: Enriching Social Data with Contextual Information for Emerging Event Extraction


ソーシャル プラットフォームは、情報を広めたり現実の社会的出来事について議論したりするための重要なプラットフォームとして台頭しており、研究者にとっては新しいイベント検出フレームワークを設計および実装する絶好の機会となります。
ソーシャル データ (ツイートなど) は、スペルミス、不完全さ、語義の曖昧さ、不規則な言語、および意見の側面のばらつきによって特徴付けられます。
これらの課題に対処するために、この論文では、ストリーミング ソーシャル データの語彙表現と文脈表現を活用する新しいフレームワーク、つまり EnrichEvent を提案します。
最終的に、私たちが提案するフレームワークは、イベントごとにクラスター チェーンを生成し、時間の経過とともに進化するイベントの変化を示します。


Social platforms have emerged as crucial platforms for disseminating information and discussing real-life social events, which offers an excellent opportunity for researchers to design and implement novel event detection frameworks. However, most existing approaches merely exploit keyword burstiness or network structures to detect unspecified events. Thus, they often fail to identify unspecified events regarding the challenging nature of events and social data. Social data, e.g., tweets, is characterized by misspellings, incompleteness, word sense ambiguation, and irregular language, as well as variation in aspects of opinions. Moreover, extracting discriminative features and patterns for evolving events by exploiting the limited structural knowledge is almost infeasible. To address these challenges, in this thesis, we propose a novel framework, namely EnrichEvent, that leverages the lexical and contextual representations of streaming social data. In particular, we leverage contextual knowledge, as well as lexical knowledge, to detect semantically related tweets and enhance the effectiveness of the event detection approaches. Eventually, our proposed framework produces cluster chains for each event to show the evolving variation of the event through time. We conducted extensive experiments to evaluate our framework, validating its high performance and effectiveness in detecting and distinguishing unspecified social events.


著者 Mohammadali Sefidi Esfahani,Mohammad Akbari
発行日 2023-08-16 09:00:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク