要約
タイトル: ビヘイビア模倣に基づく深層ニューラルネットワークの修復
要約:
– 深層ニューラルネットワーク(DNN)が安全性の高いシステムで利用されることが増える中、異常行動を示す可能性があることに関して懸念が高まっている。
– DNNの検証とテストは、予期しない動作に関する事後的な結論を提供するが、誤った動作を防ぐことはできない。
– DNNの修復/パッチは、欠陥のあるDNNによって生成された予期しない予測を排除することを目的としている。
– 2つの典型的なDNN修復パラダイムは、再トレーニングとファインチューニングである。
– 既存の方法は、状態空間の高レベル抽象的な解釈や推論に焦点を当てており、基になるニューロンの出力を無視している。
– このため、パッチ処理が計算上困難になり、大部分が分段線形(PWL)活性化関数に限定される。
– これらの欠点を解決するために、本論文ではビヘイビア模倣ベースの修復フレームワーク、BIRDNNを提案する。
– BIRDNNは、再トレーニング修復手順中に、正例の最も近い期待振る舞いを模倣して、負例の不正確な予測を修正する。
– ファインチューニング修復プロセスにおいては、BIRDNNは、正例と負例のニューロンの振る舞いの違いを分析して、誤った振る舞いの責任を最も持っているニューロンを特定する。
– より難しいドメイン別修復問題(DRP)に対処するために、BIRDNNをドメイン振る舞い特徴化技術と組み合わせて、おそらく近似された正しいスタイルでバギーDNNを修復する。
– BIRDNNに基づくプロトタイプツールを実装し、ACAS Xu DNNで評価したところ、BIRDNNは最新の修復ツールよりもはるかに高い効率でバギーDNNを修復できることが分かった。
– さらに、BIRDNNは、さまざまな活性化関数と高度に互換性がある。
要約(オリジナル)
The increasing use of deep neural networks (DNNs) in safety-critical systems has raised concerns about their potential for exhibiting ill-behaviors. While DNN verification and testing provide post hoc conclusions regarding unexpected behaviors, they do not prevent the erroneous behaviors from occurring. To address this issue, DNN repair/patch aims to eliminate unexpected predictions generated by defective DNNs. Two typical DNN repair paradigms are retraining and fine-tuning. However, existing methods focus on the high-level abstract interpretation or inference of state spaces, ignoring the underlying neurons’ outputs. This renders patch processes computationally prohibitive and limited to piecewise linear (PWL) activation functions to great extent. To address these shortcomings, we propose a behavior-imitation based repair framework, BIRDNN, which integrates the two repair paradigms for the first time. BIRDNN corrects incorrect predictions of negative samples by imitating the closest expected behaviors of positive samples during the retraining repair procedure. For the fine-tuning repair process, BIRDNN analyzes the behavior differences of neurons on positive and negative samples to identify the most responsible neurons for the erroneous behaviors. To tackle more challenging domain-wise repair problems (DRPs), we synthesize BIRDNN with a domain behavior characterization technique to repair buggy DNNs in a probably approximated correct style. We also implement a prototype tool based on BIRDNN and evaluate it on ACAS Xu DNNs. Our experimental results show that BIRDNN can successfully repair buggy DNNs with significantly higher efficiency than state-of-the-art repair tools. Additionally, BIRDNN is highly compatible with different activation functions.
arxiv情報
著者 | Zhen Liang,Taoran Wu,Changyuan Zhao,Wanwei Liu,Bai Xue,Wenjing Yang,Ji Wang |
発行日 | 2023-05-05 08:33:28+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI