TMID: A Comprehensive Real-world Dataset for Trademark Infringement Detection in E-Commerce

要約

電子商取引プラットフォームは毎年、商標侵害により多額の経済的損失を被っており、プラットフォームに登録されている販売者情報に関連する潜在的な法的リスクを特定し、軽減することが重要となっています。
しかし、高品質のデータセットが存在しないため、この分野の研究は妨げられています。
このギャップに対処するために、私たちの研究では、販売者の登録における商標侵害を検出するための新しいデータセットである TMID を導入しました。
これは、世界最大の電子商取引およびデジタル決済プラットフォームの 1 つである Alipay から直接ソースされた現実世界のデータセットです。
侵害の検出は、文脈と法的ルールの理解が必要な法的推論タスクであるため、当社は法的ルールと販売者および商標関連のコンテキスト情報の徹底的な収集を、法律専門家による注釈付きで提供します。
広範な統計分析を実行することでデータの品質を保証します。
さらに、このデータセットについて実証研究を実施し、その価値と主要な課題を明らかにします。
この研究を通じて、私たちは、電子商取引分野における商標侵害に関連する法的コンプライアンスの研究を進めるための貴重なリソースに貢献することを目指しています。
データセットは https://github.com/emnlpTMID/emnlpTMID.github.io で入手できます。

要約(オリジナル)

Annually, e-commerce platforms incur substantial financial losses due to trademark infringements, making it crucial to identify and mitigate potential legal risks tied to merchant information registered to the platforms. However, the absence of high-quality datasets hampers research in this area. To address this gap, our study introduces TMID, a novel dataset to detect trademark infringement in merchant registrations. This is a real-world dataset sourced directly from Alipay, one of the world’s largest e-commerce and digital payment platforms. As infringement detection is a legal reasoning task requiring an understanding of the contexts and legal rules, we offer a thorough collection of legal rules and merchant and trademark-related contextual information with annotations from legal experts. We ensure the data quality by performing an extensive statistical analysis. Furthermore, we conduct an empirical study on this dataset to highlight its value and the key challenges. Through this study, we aim to contribute valuable resources to advance research into legal compliance related to trademark infringement within the e-commerce sphere. The dataset is available at https://github.com/emnlpTMID/emnlpTMID.github.io .

arxiv情報

著者 Tongxin Hu,Zhuang Li,Xin Jin,Lizhen Qu,Xin Zhang
発行日 2023-12-08 15:31:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.CY, cs.LG パーマリンク