要約
この論文では、ネストされた用語を抽出することに専念するRutermeval競争への参加について説明します。
以前にネストされた名前のエンティティの認識に正常に適用されていたバインダーモデルを適用して、ネストされた用語を抽出します。
Rutermeval競争の3つのトラックすべてで、学期認識の最良の結果を得ました。
さらに、ネストされていない用語で注釈が付けられたフラットトレーニングデータから、ネストされた用語の認識という新しいタスクを研究します。
この作業で提案したいくつかのアプローチは、ネストされたラベル付けなしにネストされた用語を効果的に取得するのに十分なほど実行可能であると結論付けることができます。
要約(オリジナル)
In this paper, we describe our participation in the RuTermEval competition devoted to extracting nested terms. We apply the Binder model, which was previously successfully applied to the recognition of nested named entities, to extract nested terms. We obtained the best results of term recognition in all three tracks of the RuTermEval competition. In addition, we study the new task of recognition of nested terms from flat training data annotated with terms without nestedness. We can conclude that several approaches we proposed in this work are viable enough to retrieve nested terms effectively without nested labeling of them.
arxiv情報
著者 | Igor Rozhkov,Natalia Loukachevitch |
発行日 | 2025-04-22 16:15:37+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google