要約
医療の分野では、著作権保護と第三者による不正使用という課題がますます深刻になっています。
データの著作権保護のための従来の方法は、データの配布前に適用されます。これは、これらのデータに基づいてトレーニングされたモデルが制御不能になることを意味します。
このペーパーでは、展開段階で医療データの著作権を保護するために設計された、DataCook という新しいアプローチを紹介します。
DataCook は、配信前に生データを「クック」することによって動作し、この処理されたデータで正常に動作するモデルの開発を可能にします。
ただし、展開フェーズでは、モデルの正常なパフォーマンスを確保するために、元のテスト データも DataCook によって「クック」する必要があります。
このプロセスにより、著作権所有者は展開段階で認証を制御できるようになります。
DataCook の背後にあるメカニズムは、モデルを混乱させることを目的とした標準的な敵対的サンプル (Adv) とは対照的に、モデルの信頼性を高めるように設計された反敵対的サンプル (AntiAdv) を作成することによって行われます。
Adv と同様に、AntiAdv は目に見えない摂動を導入し、DataCook によって処理されたデータを容易に理解できる状態に保ちます。
私たちは、2D/3D データと高解像度バリアントの両方を含む MedMNIST データセットに対して広範な実験を実施しました。
この結果は、DataCook がその目的を効果的に達成し、正当なシナリオにおけるデータの有効性と正確性を損なうことなく、AntiAdv でトレーニングされたモデルが不正なデータを効果的に分析することを防止していることを示しています。
コードとデータは https://github.com/MedMNIST/DataCook で入手できます。
要約(オリジナル)
In the realm of healthcare, the challenges of copyright protection and unauthorized third-party misuse are increasingly significant. Traditional methods for data copyright protection are applied prior to data distribution, implying that models trained on these data become uncontrollable. This paper introduces a novel approach, named DataCook, designed to safeguard the copyright of healthcare data during the deployment phase. DataCook operates by ‘cooking’ the raw data before distribution, enabling the development of models that perform normally on this processed data. However, during the deployment phase, the original test data must be also ‘cooked’ through DataCook to ensure normal model performance. This process grants copyright holders control over authorization during the deployment phase. The mechanism behind DataCook is by crafting anti-adversarial examples (AntiAdv), which are designed to enhance model confidence, as opposed to standard adversarial examples (Adv) that aim to confuse models. Similar to Adv, AntiAdv introduces imperceptible perturbations, ensuring that the data processed by DataCook remains easily understandable. We conducted extensive experiments on MedMNIST datasets, encompassing both 2D/3D data and the high-resolution variants. The outcomes indicate that DataCook effectively meets its objectives, preventing models trained on AntiAdv from analyzing unauthorized data effectively, without compromising the validity and accuracy of the data in legitimate scenarios. Code and data are available at https://github.com/MedMNIST/DataCook.
arxiv情報
著者 | Sihan Shang,Jiancheng Yang,Zhenglong Sun,Pascal Fua |
発行日 | 2024-03-26 14:44:51+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google