要約
ロボット操作とは、ロボット工学と人工知能の高度な技術を使用した、ロボットの自律的な操作と物体との相互作用を指します。
大規模言語モデル (LLM) や大規模ビジョン言語モデル (LVLM) などの強力なツールの出現により、これらのロボットの環境認識と意思決定の能力が大幅に強化されました。
しかし、これらのインテリジェント エージェントの導入により、脱獄攻撃や敵対的攻撃などのセキュリティ上の脅威が発生しています。
この研究では、特にロボット操作をターゲットとしたバックドア攻撃を提案し、初めて物理世界にバックドア攻撃を実装することで、さらに一歩を踏み出しました。
バックドア視覚言語モデルをロボット システム内の視覚認識モジュールに埋め込むことで、共通のアイテムがトリガーとして存在することを前提として、物理世界におけるロボット アームの動作を誤解させることに成功しました。
物理世界での実験評価により、提案されたバックドア攻撃の有効性が実証されています。
要約(オリジナル)
Robotic manipulation refers to the autonomous handling and interaction of robots with objects using advanced techniques in robotics and artificial intelligence. The advent of powerful tools such as large language models (LLMs) and large vision-language models (LVLMs) has significantly enhanced the capabilities of these robots in environmental perception and decision-making. However, the introduction of these intelligent agents has led to security threats such as jailbreak attacks and adversarial attacks. In this research, we take a further step by proposing a backdoor attack specifically targeting robotic manipulation and, for the first time, implementing backdoor attack in the physical world. By embedding a backdoor visual language model into the visual perception module within the robotic system, we successfully mislead the robotic arm’s operation in the physical world, given the presence of common items as triggers. Experimental evaluations in the physical world demonstrate the effectiveness of the proposed backdoor attack.
arxiv情報
著者 | Xianlong Wang,Hewen Pan,Hangtao Zhang,Minghui Li,Shengshan Hu,Ziqi Zhou,Lulu Xue,Peijin Guo,Yichen Wang,Wei Wan,Aishan Liu,Leo Yu Zhang |
発行日 | 2024-12-08 15:42:22+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google