要約
ソーシャル ネットワークの普及に伴い、これらのプラットフォームで議論されているトピックを検出することが大きな課題となっています。
現在のアプローチは主に頻繁なパターンマイニングまたは意味関係に依存しており、言語の構造が無視されていることがよくあります。
言語構造手法は、単語間の関係と、人間が単語をどのように理解するかを発見することを目的としています。
そこで本論文では、単語連想の精神的能力を模倣するという概念に基づいたソーシャルネットワーク用のトピック検出フレームワークを紹介する。
このフレームワークは Human Word Association メソッドを採用しており、特別に設計された抽出アルゴリズムが含まれています。
この方法のパフォーマンスは、トピック検出分野のベンチマークである FA-CUP データセットを使用して評価されます。
結果は、トピック想起とキーワード F1 測定によって証明されるように、提案された方法が他の方法と比較してトピック検出を大幅に向上させることを示しています。
さらに、提案された方法の適用性と一般化可能性を評価するために、ペルシア語の電報投稿のデータセットが使用されます。
結果は、この方法が他のトピック検出方法よりも優れていることを示しています。
要約(オリジナル)
With the widespread use of social networks, detecting the topics discussed on these platforms has become a significant challenge. Current approaches primarily rely on frequent pattern mining or semantic relations, often neglecting the structure of the language. Language structural methods aim to discover the relationships between words and how humans understand them. Therefore, this paper introduces a topic detection framework for social networks based on the concept of imitating the mental ability of word association. This framework employs the Human Word Association method and includes a specially designed extraction algorithm. The performance of this method is evaluated using the FA-CUP dataset, a benchmark in the field of topic detection. The results indicate that the proposed method significantly improves topic detection compared to other methods, as evidenced by Topic-recall and the keyword F1 measure. Additionally, to assess the applicability and generalizability of the proposed method, a dataset of Telegram posts in the Persian language is used. The results demonstrate that this method outperforms other topic detection methods.
arxiv情報
著者 | Mehrdad Ranjbar Khadivi,Shahin Akbarpour,Mohammad-Reza Feizi-Derakhshi,Babak Anari |
発行日 | 2024-08-21 08:25:25+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google