LLM-Based Robust Product Classification in Commerce and Compliance

要約

コンプライアンス規制が確認され、製品カテゴリに基づいて税金や関税が適用されるため、製品の分類は国際貿易において重要なタスクです。
製品の手動分類は時間がかかり、間違いが発生しやすく、輸出入される製品の量が膨大であるため、手動プロセスは実行不可能です。
その結果、電子商取引プラットフォームや国際貿易に関わる企業は、機械学習を使用した自動商品分類に目を向けるようになりました。
しかし、現在のアプローチでは、非常に省略された不完全な製品説明など、製品分類に関連する現実世界の課題が考慮されていません。
さらに、生成大規模言語モデル (LLM) とその推論機能の最近の進歩は、主に製品分類や電子商取引では活用されていません。
この研究では、産業分類の実際の課題を調査し、現実的なデータ シミュレーションを可能にするデータの摂動を提案します。
さらに、LLM ベースの製品分類を採用して、不完全なデータが存在する場合の予測の堅牢性を向上させます。
私たちの調査によると、コンテキスト内学習を行う LLM は、クリーンデータのシナリオにおいて教師ありアプローチよりも優れたパフォーマンスを発揮します。
さらに、データ攻撃が存在する場合、LLM は教師ありアプローチよりも大幅に堅牢であることを示します。

要約(オリジナル)

Product classification is a crucial task in international trade, as compliance regulations are verified and taxes and duties are applied based on product categories. Manual classification of products is time-consuming and error-prone, and the sheer volume of products imported and exported renders the manual process infeasible. Consequently, e-commerce platforms and enterprises involved in international trade have turned to automatic product classification using machine learning. However, current approaches do not consider the real-world challenges associated with product classification, such as very abbreviated and incomplete product descriptions. In addition, recent advancements in generative Large Language Models (LLMs) and their reasoning capabilities are mainly untapped in product classification and e-commerce. In this research, we explore the real-life challenges of industrial classification and we propose data perturbations that allow for realistic data simulation. Furthermore, we employ LLM-based product classification to improve the robustness of the prediction in presence of incomplete data. Our research shows that LLMs with in-context learning outperform the supervised approaches in the clean-data scenario. Additionally, we illustrate that LLMs are significantly more robust than the supervised approaches when data attacks are present.

arxiv情報

著者 Sina Gholamian,Gianfranco Romani,Bartosz Rudnikowicz,Stavroula Skylaki
発行日 2024-10-15 16:18:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク