SMARAGD: Learning SMatch for Accurate and Rapid Approximate Graph Distance

要約

意味表現 (MR) などのグラフ構造の類似性は、多くの場合、Smatch (Cai および Knight、2013) などの構造マッチング アルゴリズムを介して評価されます。
ただし、Smatch には NP 完全性に問題がある組み合わせ問題が含まれるため、グラフ クラスタリングや検索などの大規模なアプリケーションが実行不可能になります。
この問題を軽減するために、SMARAGD: 正確かつ迅速なグラフ距離のセマンティック マッチを学習します。
ニューラル ネットワークが Smatch スコアを近似する可能性を示します。i) 機械翻訳フレームワークを使用して線形時間でアライメントを予測するか、ii) シャム CNN を使用して定数時間で Smatch スコアを直接予測します。
データ拡張とグラフ匿名化によって近似誤差が大幅に削減できることを示します。

要約(オリジナル)

The similarity of graph structures, such as Meaning Representations (MRs), is often assessed via structural matching algorithms, such as Smatch (Cai and Knight, 2013). However, Smatch involves a combinatorial problem that suffers from NP-completeness, making large-scale applications, e.g., graph clustering or search, infeasible. To alleviate this issue, we learn SMARAGD: Semantic Match for Accurate and Rapid Approximate Graph Distance. We show the potential of neural networks to approximate Smatch scores, i) in linear time using a machine translation framework to predict alignments, or ii) in constant time using a Siamese CNN to directly predict Smatch scores. We show that the approximation error can be substantially reduced through data augmentation and graph anonymization.

arxiv情報

著者 Juri Opitz,Philipp Meier,Anette Frank
発行日 2023-06-01 16:14:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク