Text Embedding Inversion Attacks on Multilingual Language Models


NLP では、テキスト情報を実数の埋め込みとして表現することが標準になっています。
さらに、大規模言語モデル (LLM) に対する世間の関心の高まりに伴い、Embeddings as a Service (EaaS) がビジネス モデルとして急速に注目を集めています。
これには、顕著なセキュリティ リスクがないわけではありません。これまでの研究では、機密データを生成した基礎となるモデルに関する知識がなくても、埋め込みから機密データを再構築できることが実証されています。
多くの国際企業や多言語企業が EaaS を活用しているため、多言語 LLM セキュリティに関する研究が急務となっています。
この目的を達成するために、この研究では、多言語埋め込み反転の観点から LLM セキュリティを調査します。
私たちの知る限り、この研究は反転攻撃の文脈における多言語性を掘り下げた最初の研究であり、私たちの調査結果は、NLP セキュリティの分野におけるさらなる調査と防御強化の必要性を浮き彫りにしています。


Representing textual information as real-numbered embeddings has become the norm in NLP. Moreover, with the rise of public interest in large language models (LLMs), Embeddings as a Service (EaaS) has rapidly gained traction as a business model. This is not without outstanding security risks, as previous research has demonstrated that sensitive data can be reconstructed from embeddings, even without knowledge of the underlying model that generated them. However, such work is limited by its sole focus on English, leaving all other languages vulnerable to attacks by malicious actors. %As many international and multilingual companies leverage EaaS, there is an urgent need for research into multilingual LLM security. To this end, this work investigates LLM security from the perspective of multilingual embedding inversion. Concretely, we define the problem of black-box multilingual and cross-lingual inversion attacks, with special attention to a cross-domain scenario. Our findings reveal that multilingual models are potentially more vulnerable to inversion attacks than their monolingual counterparts. This stems from the reduced data requirements for achieving comparable inversion performance in settings where the underlying language is not known a-priori. To our knowledge, this work is the first to delve into multilinguality within the context of inversion attacks, and our findings highlight the need for further investigation and enhanced defenses in the area of NLP Security.


著者 Yiyi Chen,Heather Lent,Johannes Bjerva
発行日 2024-01-22 18:34:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.CR パーマリンク