Research on feature fusion and multimodal patent text based on graph attention network

要約

クロスモーダル特徴の融合の問題、長いテキストモデリングの低い効率、特許テキストセマンティックマイニングの階層的セマンティックコヒーレンスの欠如の問題を目指して、この研究では、階層的比較学習(HCL)、マルチモーダルグラフ注意ネットワーク(M-GAT)、マルチグラニュリティスパースメッキ(MSA)、マルチガラニティスパースメッキ(MSA)を統合する深い学習フレームワークであるHGM-NETを提案しています。
HCLを介した単語、文、段落の階層に対する横断的類似性の制約。
コントラストと横断的類似性の制約は、特許テキストのローカルセマンティックおよびグローバルなテーマの一貫性を強化するために、HCLによって単語と段落レベルで構築されます。
M-GATモデル特許分類コード、引用関係、およびテキストセマンティクスは異種グラフ構造として、およびクロスモーダルゲートの注意によるマルチソース機能の動的融合を実現します。
MSAは、単語、フレーズ、文、段落の粒度での長いテキストモデリングの計算効率を最適化するために、階層的スパース戦略を採用しています。
実験は、このフレームワークが、特許分類や類似性マッチングなどのタスクの既存の深い学習方法よりも重要な利点を示し、特許取得の効率の改善と技術関連のマイニングの問題を解決するための理論的な革新と実用的な価値の両方を備えたソリューションを提供することを示しています。

要約(オリジナル)

Aiming at the problems of cross-modal feature fusion, low efficiency of long text modeling and lack of hierarchical semantic coherence in patent text semantic mining, this study proposes HGM-Net, a deep learning framework that integrates Hierarchical Comparative Learning (HCL), Multi-modal Graph Attention Network (M-GAT) and Multi-Granularity Sparse Attention (MSA), which builds a dynamic mask, contrast and cross-structural similarity constraints on the word, sentence and paragraph hierarchies through HCL. Contrast and cross-structural similarity constraints are constructed at the word and paragraph levels by HCL to strengthen the local semantic and global thematic consistency of patent text; M-GAT models patent classification codes, citation relations and text semantics as heterogeneous graph structures, and achieves dynamic fusion of multi-source features by cross-modal gated attention; MSA adopts a hierarchical sparsity strategy to optimize the computational efficiency of long text modeling at word, phrase, sentence and paragraph granularity. Experiments show that the framework demonstrates significant advantages over existing deep learning methods in tasks such as patent classification and similarity matching, and provides a solution with both theoretical innovation and practical value for solving the problems of patent examination efficiency improvement and technology relevance mining.

arxiv情報

著者 Zhenzhen Song,Ziwei Liu,Hongji Li
発行日 2025-05-26 16:32:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.IR, cs.LG パーマリンク