要約
関係分類タスクは、サブジェクト エンティティとオブジェクト エンティティのペアに適切な意味論的な関係を割り当てます。
このタスクは、ナレッジ グラフの構築や生物医学テキスト内のエンティティ相互作用の発見など、さまざまなテキスト マイニング アプリケーションで重要な役割を果たします。
現在の関係分類モデルは、単一の文内の複数の関係を識別するために追加の手順を採用しています。
さらに、彼らは不均衡な予測パターンを見落としています。
このパターンは、比較的大規模な事前定義された関係セット内に肯定的なラベル付けを必要とする有効な関係がいくつか存在することから発生します。
カスタマイズされた出力アーキテクチャを通じて、また追加の入力機能を活用することで、これらの問題に取り組む複数関係分類モデルを提案します。
私たちの調査結果は、不均衡な予測を処理することで、たとえ控えめなトレーニング設計であっても、大幅な改善につながることを示唆しています。
この結果は、関係分類で一般的に使用されるベンチマーク データセットに対する優れたパフォーマンスを示しています。
私たちの知る限り、この研究は関係分類タスク内で不均衡な予測を認識した最初の研究です。
要約(オリジナル)
The relation classification task assigns the proper semantic relation to a pair of subject and object entities; the task plays a crucial role in various text mining applications, such as knowledge graph construction and entities interaction discovery in biomedical text. Current relation classification models employ additional procedures to identify multiple relations in a single sentence. Furthermore, they overlook the imbalanced predictions pattern. The pattern arises from the presence of a few valid relations that need positive labeling in a relatively large predefined relations set. We propose a multiple relations classification model that tackles these issues through a customized output architecture and by exploiting additional input features. Our findings suggest that handling the imbalanced predictions leads to significant improvements, even on a modest training design. The results demonstrate superiority performance on benchmark datasets commonly used in relation classification. To the best of our knowledge, this work is the first that recognizes the imbalanced predictions within the relation classification task.
arxiv情報
著者 | Sakher Khalil Alqaaidi,Elika Bozorgi,Krzysztof J. Kochut |
発行日 | 2023-09-24 18:36:22+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google