要約
意味的類似性の尺度は、さまざまなコンピューター関連のタスクを促進するために、自然言語処理で広く使用されています。
ただし、単一の意味的類似性の尺度がすべてのタスクに最適というわけではないため、研究者はパフォーマンスを確保するためにアンサンブル戦略を使用することがよくあります。
この研究成果は、意味的類似性アンサンブルを自動的に設計する方法を提案します。
実際、私たちが提案する方法は、文法進化を初めて使用して、候補のプールから自動的にメジャーを選択して集計し、人間の判断との相関を最大化するアンサンブルを作成します。
この手法はいくつかのベンチマーク データセットで評価され、最先端のアンサンブルと比較され、類似性評価の精度が大幅に向上し、場合によっては既存の手法を上回るパフォーマンスを発揮できることが示されています。
その結果、私たちの研究は、文法進化を使用してテキストを自動的に比較し、意味的類似性タスクにアンサンブルを使用する利点を証明する可能性を示しています。
私たちのアプローチを示すソース コードは、https://github.com/jorge-martinez-gil/sesige からダウンロードできます。
要約(オリジナル)
Semantic similarity measures are widely used in natural language processing to catalyze various computer-related tasks. However, no single semantic similarity measure is the most appropriate for all tasks, and researchers often use ensemble strategies to ensure performance. This research work proposes a method for automatically designing semantic similarity ensembles. In fact, our proposed method uses grammatical evolution, for the first time, to automatically select and aggregate measures from a pool of candidates to create an ensemble that maximizes correlation to human judgment. The method is evaluated on several benchmark datasets and compared to state-of-the-art ensembles, showing that it can significantly improve similarity assessment accuracy and outperform existing methods in some cases. As a result, our research demonstrates the potential of using grammatical evolution to automatically compare text and prove the benefits of using ensembles for semantic similarity tasks. The source code that illustrates our approach can be downloaded from https://github.com/jorge-martinez-gil/sesige.
arxiv情報
著者 | Jorge Martinez-Gil |
発行日 | 2023-08-01 18:12:04+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google