SSL-Auth: An Authentication Framework by Fragile Watermarking for Pre-trained Encoders in Self-supervised Learning

要約

強力なエンコーダーをトレーニングするためにラベルなしのデータセットを利用する自己教師あり学習 (SSL) は、最近大きな成功を収めています。
これらのエンコーダは、大量のリソースを必要とする下流タスクの特徴抽出器として機能します。
ただし、エンコーダ トレーナーの知的財産を保護し、導入されたエンコーダの信頼性を確保するという課題は、SSL において依然として大きなギャップとなっています。
さらに、最近の研究では、バックドア攻撃や敵対的攻撃など、事前トレーニングされたエンコーダに対する脅威が浮き彫りになっています。
これらのギャップに対処するために、事前トレーニングされたエンコーダー専用に設計された初の認証フレームワークである SSL-Auth を提案します。
特に、SSL-Auth は選択されたキー サンプルを透かし情報として利用し、検証ネットワークをトレーニングして透かし情報を再構築することで、モデルのパフォーマンスを損なうことなくエンコーダの整合性を検証します。
変更されたエンコーダは元の再構成を模倣しないため、主要なサンプルの再構成結果を比較することで、悪意のある変更を検出できます。
さまざまなエンコーダとさまざまなダウンストリーム タスクに関する包括的な評価により、私たちが提案する SSL-Auth の有効性と脆弱性が実証されています。

要約(オリジナル)

Self-supervised learning (SSL), utilizing unlabeled datasets for training powerful encoders, has achieved significant success recently. These encoders serve as feature extractors for downstream tasks, requiring substantial resources. However, the challenge of protecting the intellectual property of encoder trainers and ensuring the trustworthiness of deployed encoders remains a significant gap in SSL. Moreover, recent researches highlight threats to pre-trained encoders, such as backdoor and adversarial attacks. To address these gaps, we propose SSL-Auth, the first authentication framework designed specifically for pre-trained encoders. In particular, SSL-Auth utilizes selected key samples as watermark information and trains a verification network to reconstruct the watermark information, thereby verifying the integrity of the encoder without compromising model performance. By comparing the reconstruction results of the key samples, malicious alterations can be detected, as modified encoders won’t mimic the original reconstruction. Comprehensive evaluations on various encoders and diverse downstream tasks demonstrate the effectiveness and fragility of our proposed SSL-Auth.

arxiv情報

著者 Xiaobei Li,Changchun Yin,Liming Fang,Run Wang,Chenhao Lin
発行日 2023-08-16 09:27:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CR パーマリンク