Automatic Design of Semantic Similarity Ensembles Using Grammatical Evolution

要約

意味的類似性尺度は、自然言語処理において様々なコンピュータ関連タスクの触媒として広く使用されている。しかし、単一の意味的類似度尺度が全てのタスクに最適であることはなく、研究者はしばしばアンサンブル戦略を用いて性能を確保している。本研究では、意味類似度アンサンブルを自動的に設計する手法を提案する。実際、我々の提案する手法は、文法的進化を初めて用いて、候補のプールから尺度を自動的に選択・集約し、人間の判断との相関を最大化するアンサンブルを作成する。本手法を複数のベンチマークデータセットで評価し、最先端のアンサンブルと比較した結果、類似性評価精度を大幅に向上させることができ、場合によっては既存の手法を凌駕することが示された。その結果、我々の研究は、文法的進化を利用してテキストを自動的に比較する可能性を示し、意味的類似性タスクにアンサンブルを利用する利点を証明する。我々のアプローチを示すソースコードは、https://github.com/jorge-martinez-gil/sesige からダウンロードできる。

要約(オリジナル)

Semantic similarity measures are widely used in natural language processing to catalyze various computer-related tasks. However, no single semantic similarity measure is the most appropriate for all tasks, and researchers often use ensemble strategies to ensure performance. This research work proposes a method for automatically designing semantic similarity ensembles. In fact, our proposed method uses grammatical evolution, for the first time, to automatically select and aggregate measures from a pool of candidates to create an ensemble that maximizes correlation to human judgment. The method is evaluated on several benchmark datasets and compared to state-of-the-art ensembles, showing that it can significantly improve similarity assessment accuracy and outperform existing methods in some cases. As a result, our research demonstrates the potential of using grammatical evolution to automatically compare text and prove the benefits of using ensembles for semantic similarity tasks. The source code that illustrates our approach can be downloaded from https://github.com/jorge-martinez-gil/sesige.

arxiv情報

著者 Jorge Martinez-Gil
発行日 2023-08-04 06:15:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CL パーマリンク