Adaptive Taxonomy Learning and Historical Patterns Modelling for Patent Classification

要約

特許分類は、特定の特許に複数の国際特許分類 (IPC) コードを割り当てることを目的としています。
特許を自動的に分類するための最近の方法は、主に特許のテキスト説明の分析に焦点を当てています。
ただし、テキストとは別に、各特許は一部の譲受人にも関連付けられており、出願された特許に関する知識が分類に役立つことがよくあります。
さらに、IPC システムによって定式化された階層分類法は重要なコンテキスト情報を提供し、モデルが IPC コード間の相関を活用してより正確な分類を行うことができるようになります。
しかし、既存の方法には上記の側面が組み込まれていません。
本稿では、特許情報を総合的に考慮して特許を分類する統合フレームワークを提案します。
具体的には、最初に、同じレベル内および階層分類に沿った異なるレベル間でメッセージを適応的に受け渡し、集約することにより、意味論的表現を導出する IPC コード相関学習モジュールを提示します。
さらに、デュアルチャネル集約メカニズムによって対応する譲受人の以前の特許を組み込むための過去のアプリケーションパターン学習コンポーネントを設計します。
最後に、IPC コードのセマンティクスを含む特許テキストのコンテキスト情報と譲受人の一連の優先順位を組み合わせて予測を行います。
現実世界のデータセットでの実験により、既存の手法に対する私たちのアプローチの優位性が実証されました。
さらに、譲受人の時間的パターンと IPC コード間の意味論的な依存関係を捕捉するモデルの機能を示します。

要約(オリジナル)

Patent classification aims to assign multiple International Patent Classification (IPC) codes to a given patent. Recent methods for automatically classifying patents mainly focus on analyzing the text descriptions of patents. However, apart from the texts, each patent is also associated with some assignees, and the knowledge of their applied patents is often valuable for classification. Furthermore, the hierarchical taxonomy formulated by the IPC system provides important contextual information and enables models to leverage the correlations between IPC codes for more accurate classification. However, existing methods fail to incorporate the above aspects. In this paper, we propose an integrated framework that comprehensively considers the information on patents for patent classification. To be specific, we first present an IPC codes correlations learning module to derive their semantic representations via adaptively passing and aggregating messages within the same level and across different levels along the hierarchical taxonomy. Moreover, we design a historical application patterns learning component to incorporate the corresponding assignee’s previous patents by a dual channel aggregation mechanism. Finally, we combine the contextual information of patent texts that contains the semantics of IPC codes, and assignees’ sequential preferences to make predictions. Experiments on real-world datasets demonstrate the superiority of our approach over the existing methods. Besides, we present the model’s ability to capture the temporal patterns of assignees and the semantic dependencies among IPC codes.

arxiv情報

著者 Tao Zou,Le Yu,Leilei Sun,Bowen Du,Deqing Wang,Fuzhen Zhuang
発行日 2023-08-10 07:02:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク