A Survey on Contextualised Semantic Shift Detection

要約

セマンティックシフト検出 (SSD) は、ターゲット単語の意味の時間の経過に伴う変化の可能性を識別、解釈、評価するタスクです。
従来、SSD は言語学者や社会科学者によって手作業で時間のかかる作業を通じて対処されてきました。
近年、SSD を可能な限り自動化するために、自然言語処理と単語埋め込みに基づく計算アプローチがますます注目を集めています。
特に、過去 3 年間で、単語の複数の用法/意味を処理し、関連する意味論的な変化をより適切に捉えることができる、単語の文脈化された埋め込みモデルにほぼのみ基づいて大幅な進歩が行われました。
この論文では、SSD のコンテキスト化された埋め込み (CSSDetection) に基づくアプローチを調査し、意味表現、時間認識、および学習モダリティの次元によって特徴付けられる分類フレームワークを提案します。
このフレームワークは、i) シフト評価の尺度をレビューするために、ii) パフォーマンスに関するアプローチを比較するために、そして iii) スケーラビリティ、解釈可能性、および堅牢性の観点から現在の問題を議論するために利用されます。
CSSDetection に関する未解決の課題と今後の研究の方向性が最終的に概説されます。

要約(オリジナル)

Semantic Shift Detection (SSD) is the task of identifying, interpreting, and assessing the possible change over time in the meanings of a target word. Traditionally, SSD has been addressed by linguists and social scientists through manual and time-consuming activities. In the recent years, computational approaches based on Natural Language Processing and word embeddings gained increasing attention to automate SSD as much as possible. In particular, over the past three years, significant advancements have been made almost exclusively based on word contextualised embedding models, which can handle the multiple usages/meanings of the words and better capture the related semantic shifts. In this paper, we survey the approaches based on contextualised embeddings for SSD (i.e., CSSDetection) and we propose a classification framework characterised by meaning representation, time-awareness, and learning modality dimensions. The framework is exploited i) to review the measures for shift assessment, ii) to compare the approaches on performance, and iii) to discuss the current issues in terms of scalability, interpretability, and robustness. Open challenges and future research directions about CSSDetection are finally outlined.

arxiv情報

著者 Stefano Montanelli,Francesco Periti
発行日 2024-06-11 15:33:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク