A Comparative Study on Enhancing Prediction in Social Network Advertisement through Data Augmentation

要約

進化し続けるソーシャル ネットワーク広告の状況では、データの量と精度が予測モデルのパフォーマンスに重要な役割を果たします。
ただし、堅牢な予測アルゴリズムの開発は、現実世界のデータセットに存在する限られたサイズと潜在的なバイアスによって妨げられることがよくあります。
この研究では、ソーシャル ネットワーク広告データの生成拡張フレームワークを提示し、調査します。
私たちのフレームワークは、ソーシャル ネットワーク広告分析の有効性の観点からデータの可用性と多様性を強化するために、データ拡張のための 3 つの生成モデル、敵対的生成ネットワーク (GAN)、変分オートエンコーダー (VAE)、ガウス混合モデル (GMM) を検討します。
特徴空間の合成拡張を実行することにより、データ拡張を通じてさまざまな分類器のパフォーマンスが定量的に向上したことがわかります。
さらに、各データ拡張手法によってもたらされる相対的なパフォーマンスの向上を比較し、モデルのパフォーマンスを向上させる適切な手法を選択するための洞察を実践者に提供します。
この論文は、合成データの拡張により、ソーシャル ネットワーク広告の分野における小さいデータセットまたは不均衡なデータセットによって課せられる制限が軽減されることを示し、文献に貢献します。
同時に、この記事では、さまざまなデータ拡張手法の実用性についての比較的な観点も提供し、それによって実務者がモデルのパフォーマンスを向上させる適切な手法を選択できるようにガイドします。

要約(オリジナル)

In the ever-evolving landscape of social network advertising, the volume and accuracy of data play a critical role in the performance of predictive models. However, the development of robust predictive algorithms is often hampered by the limited size and potential bias present in real-world datasets. This study presents and explores a generative augmentation framework of social network advertising data. Our framework explores three generative models for data augmentation – Generative Adversarial Networks (GANs), Variational Autoencoders (VAEs), and Gaussian Mixture Models (GMMs) – to enrich data availability and diversity in the context of social network advertising analytics effectiveness. By performing synthetic extensions of the feature space, we find that through data augmentation, the performance of various classifiers has been quantitatively improved. Furthermore, we compare the relative performance gains brought by each data augmentation technique, providing insights for practitioners to select appropriate techniques to enhance model performance. This paper contributes to the literature by showing that synthetic data augmentation alleviates the limitations imposed by small or imbalanced datasets in the field of social network advertising. At the same time, this article also provides a comparative perspective on the practicality of different data augmentation methods, thereby guiding practitioners to choose appropriate techniques to enhance model performance.

arxiv情報

著者 Qikai Yang,Panfeng Li,Xinhe Xu,Zhicheng Ding,Wenjing Zhou,Yi Nian
発行日 2024-04-24 02:43:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.SI パーマリンク