Classification of retail products: From probabilistic ranking to neural networks

要約

食品小売業は現在、消費者の意思決定プロセスのあらゆる段階で新たな価値創造の方法により、デジタル市場への浸透を成功させるための加速した道を歩んでいます。
この過程で最も重要な義務の 1 つは、デジタル変革のすべてのプロセスに供給する高品質のデータを利用できるようにすることです。
しかし、食料品市場のさまざまな製品やサプライヤーを考慮すると、データの品質はそれほど明白ではありません。
食料品業界のデジタル変革という文脈の中で、\textit{Midiadia} はスペインのデータ プロバイダー会社です。小売業者の製品からのデータを、製品ラベルからの属性と洞察を備えた知識に変換すること、つまり、品質データを動的に維持することに取り組んでいます。
製品の分散性が高い市場。
現在、製品のラベルやパッケージから直接抽出された情報 (テキスト処理) に基づいて、製品 (食料品) を手動で分類しています。
このペーパーでは、絶えず変化する製品カタログを 3 レベルの食品分類に自動的に分類するソリューションを紹介します。
私たちの提案では、スコアベースのランキング手法、従来の機械学習アルゴリズム、ディープ ニューラル ネットワークという 3 つの異なるアプローチを研究しています。
したがって、当社は、会社の主要資産である食料品カタログのより効率的でエラーが発生しにくいメンテナンスをサポートする 4 つの異なる分類子を提供します。
最後に、これら 3 つの代替案のパフォーマンスを比較し、従来の機械学習アルゴリズムのパフォーマンスが優れているものの、スコアベースのアプローチがそれに続くという結論に達しました。

要約(オリジナル)

Food retailing is now on an accelerated path to a success penetration into the digital market by new ways of value creation at all stages of the consumer decision process. One of the most important imperatives in this path is the availability of quality data to feed all the process in digital transformation. But the quality of data is not so obvious if we consider the variety of products and suppliers in the grocery market. Within this context of digital transformation of grocery industry, \textit{Midiadia} is Spanish data provider company that works on converting data from the retailers’ products into knowledge with attributes and insights from the product labels, that is, maintaining quality data in a dynamic market with a high dispersion of products. Currently, they manually categorize products (groceries) according to the information extracted directly (text processing) from the product labelling and packaging. This paper introduces a solution to automatically categorize the constantly changing product catalogue into a 3-level food taxonomy. Our proposal studies three different approaches: a score-based ranking method, traditional machine learning algorithms, and deep neural networks. Thus, we provide four different classifiers that support a more efficient and less error-prone maintenance of groceries catalogues, the main asset of the company. Finally, we have compared the performance of these three alternatives, concluding that traditional machine learning algorithms perform better, but closely followed by the score-based approach.

arxiv情報

著者 Manar Mohamed Hafez,Rebeca P. Díaz Redondo,Ana Fernández-Vilas,Héctor Olivera Pazó
発行日 2023-12-12 18:11:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク