An Efficient Self-Supervised Cross-View Training For Sentence Embedding

要約

自己教師付き文表現学習は、人間のアノテーション作業に頼らずに、文の埋め込み空間を構築するタスクである。1つの簡単なアプローチは、事前訓練された言語モデル(PLM)を対照学習などの表現学習手法で微調整することである。このアプローチは大規模なPLMでは素晴らしい性能を達成するが、パラメータ数が減少するにつれて性能は急速に低下する。本論文では、大規模PLMと小規模PLMの性能差を縮めるために、自己教師付きクロスビュー学習(Self-supervised Cross-View Training: SCT)と呼ばれるフレームワークを提案する。SCTの有効性を評価するため、パラメータ数が4Mから340Mまでの5つのPLMを用いた7つの意味的テキスト類似度(STS)ベンチマークにおいて、5つのベースライン及び最先端の競合と比較する。実験の結果、パラメータ数が100M未満のPLMでは、21ケース中18ケースでSTCが競合を凌駕した。

要約(オリジナル)

Self-supervised sentence representation learning is the task of constructing an embedding space for sentences without relying on human annotation efforts. One straightforward approach is to finetune a pretrained language model (PLM) with a representation learning method such as contrastive learning. While this approach achieves impressive performance on larger PLMs, the performance rapidly degrades as the number of parameters decreases. In this paper, we propose a framework called Self-supervised Cross-View Training (SCT) to narrow the performance gap between large and small PLMs. To evaluate the effectiveness of SCT, we compare it to 5 baseline and state-of-the-art competitors on seven Semantic Textual Similarity (STS) benchmarks using 5 PLMs with the number of parameters ranging from 4M to 340M. The experimental results show that STC outperforms the competitors for PLMs with less than 100M parameters in 18 of 21 cases.

arxiv情報

著者 Peerat Limkonchotiwat,Wuttikorn Ponwitayarat,Lalita Lowphansirikul,Can Udomcharoenchaikit,Ekapol Chuangsuwanich,Sarana Nutanong
発行日 2023-11-06 16:12:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CL パーマリンク