Fake detection in imbalance dataset by Semi-supervised learning with GAN

要約

ソーシャルメディアが急速に成長するにつれて、ハラスメントはより蔓延しており、研究者の間では偽検出が魅力的な分野であると考えられています。
多数のノードを含むデータのグラフの性質により、データセット内の高分散クラスや不均衡クラスなど、行列内の無関係な特徴が大量に含まれるなど、さまざまな障害が発生しました。
これらの問題に対処するために、自動エンコーダー、半教師あり学習と SGAN と呼ばれる GAN アルゴリズムの組み合わせが使用されました。
このペーパーでは、少数のラベルを展開し、分類器として SGAN を適用しています。
このテストの結果は、わずか 100 個のラベル付きサンプルを使用した偽アカウントの検出精度が 91% に達したことを示しました。

要約(オリジナル)

As social media grows faster, harassment becomes more prevalent which leads to considered fake detection a fascinating field among researchers. The graph nature of data with the large number of nodes caused different obstacles including a considerable amount of unrelated features in matrices as high dispersion and imbalance classes in the dataset. To deal with these issues Auto-encoders and a combination of semi-supervised learning and the GAN algorithm which is called SGAN were used. This paper is deploying a smaller number of labels and applying SGAN as a classifier. The result of this test showed that the accuracy had reached 91\% in detecting fake accounts using only 100 labeled samples.

arxiv情報

著者 Jinus Bordbar,Saman Ardalan,Mohammadreza Mohammadrezaie,Mohammad Ebrahim Shiri
発行日 2023-09-06 11:38:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CR, cs.LG パーマリンク