DNG: Taxonomy Expansion by Exploring the Intrinsic Directed Structure on Non-gaussian Space

要約

分類法の拡張は、多数の追加ノード (つまり「クエリ」) を既存の分類法 (つまり「シード」) に組み込むプロセスであり、最も重要なステップは各クエリの適切な位置を選択することです。
種子の構造を調査することによって多大な努力がなされてきました。
ただし、既存のアプローチは、階層的なセマンティクスのモデリングが不十分であり、is-a 関係の方向性を捉えることができないという 2 つの点で、構造情報のマイニングが不十分です。
このホワイト ペーパーでは、各ノードを継承された機能 (つまり、構造部分) と増分機能 (つまり、補足部分) の組み合わせとして明示的に示すことによって、これらの問題に対処しようとしています。
具体的には、継承された機能は「親」ノードから発生し、継承係数によって重み付けされます。
このノード表現により、タクソノミーにおけるセマンティクスの階層 (つまり、「親」から「子」への機能の継承と蓄積) を具現化できます。
さらに、この表現に基づいて、is-a 関係の方向性は、機能の不可逆的な継承に簡単に変換できます。
Darmois-Skitovich の定理に着想を得て、補足機能に対する非ガウス制約によってこの不可逆性を実装します。
対数尤度学習目標をさらに利用して、提案されたモデル (DNG と呼ばれる) を最適化します。これにより、必要な非ガウス性も理論的に保証されます。
2 つの現実世界のデータセットに関する広範な実験結果は、いくつかの強力なベースラインと比較して DNG の優位性を検証しています。

要約(オリジナル)

Taxonomy expansion is the process of incorporating a large number of additional nodes (i.e., ‘queries’) into an existing taxonomy (i.e., ‘seed’), with the most important step being the selection of appropriate positions for each query. Enormous efforts have been made by exploring the seed’s structure. However, existing approaches are deficient in their mining of structural information in two ways: poor modeling of the hierarchical semantics and failure to capture directionality of is-a relation. This paper seeks to address these issues by explicitly denoting each node as the combination of inherited feature (i.e., structural part) and incremental feature (i.e., supplementary part). Specifically, the inherited feature originates from ‘parent’ nodes and is weighted by an inheritance factor. With this node representation, the hierarchy of semantics in taxonomies (i.e., the inheritance and accumulation of features from ‘parent’ to ‘child’) could be embodied. Additionally, based on this representation, the directionality of is-a relation could be easily translated into the irreversible inheritance of features. Inspired by the Darmois-Skitovich Theorem, we implement this irreversibility by a non-Gaussian constraint on the supplementary feature. A log-likelihood learning objective is further utilized to optimize the proposed model (dubbed DNG), whereby the required non-Gaussianity is also theoretically ensured. Extensive experimental results on two real-world datasets verify the superiority of DNG relative to several strong baselines.

arxiv情報

著者 Songlin Zhai,Weiqing Wang,Yuanfang Li,Yuan Meng
発行日 2023-03-21 13:28:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク