要約
大規模言語モデル (LLM) の最近の進歩により、人間と機械の間の高品質テキスト生成の境界があいまいになり、これは生成テキスト ステガノグラフィにとって有利です。
一方、現在の高度なステガノグラフィー マッピングは、ほとんどのユーザーが LLM のブラック ボックス API またはユーザー インターフェイスのみにアクセスするように制限されているため、トレーニング語彙とそのサンプリング確率にアクセスできないため、LLM には適していません。
この論文では、LLM-Stega と呼ばれる、大規模言語モデルのユーザー インターフェイスに基づくブラック ボックス生成テキスト ステガノグラフィー手法を検討します。
LLM-Stega の主な目的は、アリス (送信者) とボブ (受信者) の間の安全な秘密通信が、LLM のユーザー インターフェイスを使用して実行されることです。
具体的には、まずキーワードセットを構築し、秘密メッセージを埋め込むための新しい暗号化ステガノグラフィーマッピングを設計します。
さらに、秘密メッセージの正確な抽出と生成されたステゴテキストの豊富なセマンティクスを保証するために、拒否サンプリングに基づく最適化メカニズムが提案されています。
包括的な実験により、提案された LLM-Stega が現在の最先端の方法よりも優れたパフォーマンスを発揮することが実証されました。
要約(オリジナル)
Recent advances in large language models (LLMs) have blurred the boundary of high-quality text generation between humans and machines, which is favorable for generative text steganography. While, current advanced steganographic mapping is not suitable for LLMs since most users are restricted to accessing only the black-box API or user interface of the LLMs, thereby lacking access to the training vocabulary and its sampling probabilities. In this paper, we explore a black-box generative text steganographic method based on the user interfaces of large language models, which is called LLM-Stega. The main goal of LLM-Stega is that the secure covert communication between Alice (sender) and Bob (receiver) is conducted by using the user interfaces of LLMs. Specifically, We first construct a keyword set and design a new encrypted steganographic mapping to embed secret messages. Furthermore, to guarantee accurate extraction of secret messages and rich semantics of generated stego texts, an optimization mechanism based on reject sampling is proposed. Comprehensive experiments demonstrate that the proposed LLM-Stega outperforms current state-of-the-art methods.
arxiv情報
著者 | Jiaxuan Wu,Zhengxian Wu,Yiming Xue,Juan Wen,Wanli Peng |
発行日 | 2024-11-05 13:18:31+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google