Actively Supervised Clustering for Open Relation Extraction

要約

現在のクラスタリング ベースの Open Relation Extraction (OpenRE) メソッドは、通常 2 段階のパイプラインを採用しています。
最初の段階では、関係表現と代入を同時に学習します。
第 2 段階では、いくつかのインスタンスに手動でラベルを付け、各クラスターの関係に名前を付けます。
ただし、教師なしの目標では、モデルを最適化して正確なクラスタリングの割り当てを導き出すのが難しく、クラスタの数を事前に指定する必要があります。
この論文では、OpenRE のアクティブ監視クラスタリングと呼ばれる新しい設定を紹介します。
私たちの洞察は、クラスタリングの学習と関係のラベル付けを交互に実行でき、人間の労力を大幅に増やすことなくクラスタリングに必要なガイダンスを提供できるという点にあります。
設定の鍵となるのは、どのインスタンスにラベルを付けるかを選択することです。
固定の既知クラス用に設計された古典的なアクティブラベル付け戦略を使用する代わりに、未知の関係のクラスターを動的に発見するために適用できる新しい戦略を提案します。
実験結果は、私たちの方法がデータ内のほぼすべてのリレーショナル クラスターを検出でき、2 つのデータセットで SOTA 方法をそれぞれ 10.3\% と 5.2\% 改善できることを示しています。

要約(オリジナル)

Current clustering-based Open Relation Extraction (OpenRE) methods usually adopt a two-stage pipeline. The first stage simultaneously learns relation representations and assignments. The second stage manually labels several instances and thus names the relation for each cluster. However, unsupervised objectives struggle to optimize the model to derive accurate clustering assignments, and the number of clusters has to be supplied in advance. In this paper, we present a novel setting, named actively supervised clustering for OpenRE. Our insight lies in that clustering learning and relation labeling can be alternately performed, providing the necessary guidance for clustering without a significant increase in human effort. The key to the setting is selecting which instances to label. Instead of using classical active labeling strategies designed for fixed known classes, we propose a new strategy, which is applicable to dynamically discover clusters of unknown relations. Experimental results show that our method is able to discover almost all relational clusters in the data and improve the SOTA methods by 10.3\% and 5.2\%, on two datasets respectively.

arxiv情報

著者 Jun Zhao,Yongxin Zhang,Qi Zhang,Tao Gui,Zhongyu Wei,Minlong Peng,Mingming Sun
発行日 2023-06-08 06:55:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク