An Exploration of Clustering Algorithms for Customer Segmentation in the UK Retail Market

要約

最近、オンライン購入に対する人々の意識が非常に高まっています。
これにより、オンライン小売プラットフォームが誕生し、顧客の購買行動をより深く理解する必要が生じました。
小売企業は大量の顧客購入に対処する必要に迫られており、より正確かつ効率的に顧客をセグメント化するための洗練されたアプローチが必要です。
顧客セグメンテーションは、顧客中心のサービスを支援し、収益性を高めるマーケティング分析ツールです。
このペーパーでは、小売市場業界における意思決定プロセスを改善するための顧客セグメンテーション モデルを開発することを目的としています。
これを達成するために、UCI 機械学習リポジトリから取得した英国ベースのオンライン小売データセットを採用しました。
小売データセットは、541,909 件の顧客レコードと 8 つの特徴で構成されています。
私たちの調査では、顧客の価値を定量化するために RFM (最新性、頻度、金額) フレームワークを採用しました。
その後、いくつかの最先端 (SOTA) クラスタリング アルゴリズム、つまり、K 平均法クラスタリング、ガウス混合モデル (GMM)、ノイズのあるアプリケーションの密度ベースの空間クラスタリング (DBSCAN)、凝集クラスタリング、および
階層を使用したバランスの取れた反復削減とクラスタリング (BIRCH)。
結果は、GMM が他のアプローチよりも優れたパフォーマンスを示し、シルエット スコアは 0.80 でした。

要約(オリジナル)

Recently, peoples awareness of online purchases has significantly risen. This has given rise to online retail platforms and the need for a better understanding of customer purchasing behaviour. Retail companies are pressed with the need to deal with a high volume of customer purchases, which requires sophisticated approaches to perform more accurate and efficient customer segmentation. Customer segmentation is a marketing analytical tool that aids customer-centric service and thus enhances profitability. In this paper, we aim to develop a customer segmentation model to improve decision-making processes in the retail market industry. To achieve this, we employed a UK-based online retail dataset obtained from the UCI machine learning repository. The retail dataset consists of 541,909 customer records and eight features. Our study adopted the RFM (recency, frequency, and monetary) framework to quantify customer values. Thereafter, we compared several state-of-the-art (SOTA) clustering algorithms, namely, K-means clustering, the Gaussian mixture model (GMM), density-based spatial clustering of applications with noise (DBSCAN), agglomerative clustering, and balanced iterative reducing and clustering using hierarchies (BIRCH). The results showed the GMM outperformed other approaches, with a Silhouette Score of 0.80.

arxiv情報

著者 Jeen Mary John,Olamilekan Shobayo,Bayode Ogunleye
発行日 2024-02-06 15:58:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, H.3.3, stat.AP, stat.CO パーマリンク