要約
人工知能は医療データ分析において大きな進歩を遂げましたが、堅牢性と信頼性に欠けているため、これらの手法は広く導入されていません。
すべてのシナリオで正確なネットワークをトレーニングすることは不可能であるため、モデルは自信を持って動作できない状況を認識する必要があります。
ベイジアン深層学習手法では、モデルのパラメーター空間をサンプリングして不確実性を推定しますが、これらのパラメーターは多くの場合、同じ脆弱性の影響を受け、敵対的攻撃によって悪用される可能性があります。
我々は、ネットワークに多様な相補的特徴を学習させ、摂動ベースの騙しの可能性を減らすための、特徴非相関化とフーリエ分割に基づく新しいアンサンブルアプローチを提案します。
シングルおよびマルチチャネル心電図分類に関するアプローチをテストし、比較のために敵対的トレーニングと DVERGE をベイジアン アンサンブル フレームワークに適応させます。
私たちの結果は、無相関化とフーリエ分割の組み合わせが一般に、摂動のないデータに対するパフォーマンスを維持しながら、投影された勾配降下法やさまざまな規模のスムーズな敵対的攻撃に対して優れたロバスト性と不確実性の推定を実証していることを示しています。
さらに、私たちのアプローチは敵対的サンプルを使用した高価な最適化を必要とせず、敵対的トレーニングや DVERGE よりもトレーニング プロセスに追加するコンピューティングの量がはるかに少なくなります。
これらの方法を他のタスクに適用すると、より堅牢で信頼できるモデルが得られます。
要約(オリジナル)
Artificial intelligence has made great progress in medical data analysis, but the lack of robustness and trustworthiness has kept these methods from being widely deployed. As it is not possible to train networks that are accurate in all scenarios, models must recognize situations where they cannot operate confidently. Bayesian deep learning methods sample the model parameter space to estimate uncertainty, but these parameters are often subject to the same vulnerabilities, which can be exploited by adversarial attacks. We propose a novel ensemble approach based on feature decorrelation and Fourier partitioning for teaching networks diverse complementary features, reducing the chance of perturbation-based fooling. We test our approach on single and multi-channel electrocardiogram classification, and adapt adversarial training and DVERGE into the Bayesian ensemble framework for comparison. Our results indicate that the combination of decorrelation and Fourier partitioning generally maintains performance on unperturbed data while demonstrating superior robustness and uncertainty estimation on projected gradient descent and smooth adversarial attacks of various magnitudes. Furthermore, our approach does not require expensive optimization with adversarial samples, adding much less compute to the training process than adversarial training or DVERGE. These methods can be applied to other tasks for more robust and trustworthy models.
arxiv情報
著者 | Christopher Wiedeman,Ge Wang |
発行日 | 2024-02-16 17:12:46+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google