要約
自律型ロボット (RAV) はセンサーに依存して認識し、安全かつタイムリーな運用のために厳格なミッション仕様 (高度、速度、ジオフェンスの制約など) に従っています。
物理的な攻撃により RAV のセンサーが破損し、ミッションが失敗する可能性があります。
このような攻撃から RAV を回復するには、RAV の安全性とタイムリーな動作を確保するために、攻撃下でもミッション仕様への準拠を維持する堅牢な制御技術が必要です。
ミッション仕様に準拠し、RAVを安全に回収する技術「SpecGuard」を提案します。
SpecGuard には 2 つの革新があります。
まず、ミッション仕様を組み込み、深層強化学習(Deep-RL)を用いて回復制御方針を学習するアプローチを紹介します。
当社は、RAV の複雑なダイナミクスを反映し、SpecGuard が複数のミッション仕様を同時に満たせるようにするコンプライアンス ベースの報酬構造を設計します。
第 2 に、SpecGuard には、攻撃によるセンサーの混乱を最小限に抑える技術である状態再構築が組み込まれています。
この再構築により、効果的な敵対的トレーニングが可能になり、攻撃に対する堅牢性を確保するために回復制御ポリシーを最適化できます。
SpecGuard を仮想 RAV と実際の RAV の両方で評価したところ、さまざまなセンサーへの攻撃に対して、クラッシュや停止を起こすことなく 92% の回復成功率を達成していることがわかりました。
SpecGuard は、以前の研究よりも 2 倍高い回復成功率を達成し、実際の RAV では約 15% のパフォーマンス オーバーヘッドが発生します。
要約(オリジナル)
Robotic Autonomous Vehicles (RAVs) rely on their sensors for perception, and follow strict mission specifications (e.g., altitude, speed, and geofence constraints) for safe and timely operations. Physical attacks can corrupt the RAVs’ sensors, resulting in mission failures. Recovering RAVs from such attacks demands robust control techniques that maintain compliance with mission specifications even under attacks to ensure the RAV’s safety and timely operations. We propose SpecGuard, a technique that complies with mission specifications and performs safe recovery of RAVs. There are two innovations in SpecGuard. First, it introduces an approach to incorporate mission specifications and learn a recovery control policy using Deep Reinforcement Learning (Deep-RL). We design a compliance-based reward structure that reflects the RAV’s complex dynamics and enables SpecGuard to satisfy multiple mission specifications simultaneously. Second, SpecGuard incorporates state reconstruction, a technique that minimizes attack induced sensor perturbations. This reconstruction enables effective adversarial training, and optimizing the recovery control policy for robustness under attacks. We evaluate SpecGuard in both virtual and real RAVs, and find that it achieves 92% recovery success rate under attacks on different sensors, without any crashes or stalls. SpecGuard achieves 2X higher recovery success than prior work, and incurs about 15% performance overhead on real RAVs.
arxiv情報
著者 | Pritam Dash,Ethan Chan,Karthik Pattabiraman |
発行日 | 2024-08-27 17:01:13+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google