$\textit{Rank, Chunk and Expand}$: Lineage-Oriented Reasoning for Taxonomy Expansion

要約

分類法は、推奨システムおよびWebアプリケーションに不可欠な階層的な知識グラフです。
データが増えるにつれて、分類法の拡大が不可欠ですが、既存の方法は重要な課題に直面しています。(1)差別的モデルは表現の制限と一般化に苦しんでいますが、(2)生成方法は、すべての候補を一度に処理し、ノイズとコンテキストの制限を超えるか、ノイジー候補を選択して関連するエンティティを破棄します。
lorex($ \ textbf {l} $ ineage-$ \ textbf {o} $ riented $ \ textbf {re} $分類e $ \ textbf {x} $ pansion)は、有効なランキングと有効な拡張のための生成的推論の拡大を組み合わせたプラグアンドプレイフレームワークを組み合わせて提案します。
以前の方法とは異なり、Lorexは候補者の用語をバッチにランク付けし、候補者のフィルタリング、候補者の階層を推論して文脈効率を確保することにより、選択を繰り返し精製します。
4つのベンチマークと12のベースラインにわたる広範な実験により、Lorexが最先端の方法で正確性を12%、Wu&Palmerの類似性を5%改善することが示されています。

要約(オリジナル)

Taxonomies are hierarchical knowledge graphs crucial for recommendation systems, and web applications. As data grows, expanding taxonomies is essential, but existing methods face key challenges: (1) discriminative models struggle with representation limits and generalization, while (2) generative methods either process all candidates at once, introducing noise and exceeding context limits, or discard relevant entities by selecting noisy candidates. We propose LORex ($\textbf{L}$ineage-$\textbf{O}$riented $\textbf{Re}$asoning for Taxonomy E$\textbf{x}$pansion), a plug-and-play framework that combines discriminative ranking and generative reasoning for efficient taxonomy expansion. Unlike prior methods, LORex ranks and chunks candidate terms into batches, filtering noise and iteratively refining selections by reasoning candidates’ hierarchy to ensure contextual efficiency. Extensive experiments across four benchmarks and twelve baselines show that LORex improves accuracy by 12% and Wu & Palmer similarity by 5% over state-of-the-art methods.

arxiv情報

著者 Sahil Mishra,Kumar Arjun,Tanmoy Chakraborty
発行日 2025-05-19 16:06:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク