Automatic Design of Semantic Similarity Ensembles Using Grammatical Evolution

要約

セマンティックな類似性測定は、ドキュメント分析、要件マッチング、ユーザー入力解釈などの自然言語処理タスクの重要なコンポーネントです。
ただし、個々の測定のパフォーマンスはデータセットによって大きく異なります。
これに対処するために、多くの場合、複数のメジャーを組み合わせたアンサンブルアプローチが採用されます。
このペーパーでは、セマンティックな類似性アンサンブルを構築するための文法の進化に基づいた自動戦略を紹介します。
この方法は、ヒト標識類似性スコアとの相関を最大化する集約関数を進化させます。
標準ベンチマークデータセットの実験は、提案されたアプローチが精度の観点から既存のアンサンブル技術を上回ることを示しています。
結果は、適応的で正確な類似性モデルを設計する際の文法的進化の有効性を裏付けています。
私たちのアプローチを示すソースコードは、https://github.com/jorge-martinez-gil/sesigeからダウンロードできます。

要約(オリジナル)

Semantic similarity measures are a key component in natural language processing tasks such as document analysis, requirement matching, and user input interpretation. However, the performance of individual measures varies considerably across datasets. To address this, ensemble approaches that combine multiple measures are often employed. This paper presents an automated strategy based on grammatical evolution for constructing semantic similarity ensembles. The method evolves aggregation functions that maximize correlation with human-labeled similarity scores. Experiments on standard benchmark datasets demonstrate that the proposed approach outperforms existing ensemble techniques in terms of accuracy. The results confirm the effectiveness of grammatical evolution in designing adaptive and accurate similarity models. The source code that illustrates our approach can be downloaded from https://github.com/jorge-martinez-gil/sesige.

arxiv情報

著者 Jorge Martinez-Gil
発行日 2025-04-25 10:11:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク