要約
ロボット支援低侵襲手術は現在、訓練を受けた外科医によって完全に手動で制御されています。
これを自動化することは、問題を軽減する大きな可能性、例えば、物理的なひずみ、非常に反復的なタスク、訓練された外科医の不足があります。
これらの理由により、最近の作品は人工知能方法を利用しており、有望な適応性を示しています。
これらの進歩にもかかわらず、説明可能性と堅牢な安全保証がないため、これらの方法には懐疑的です。
このペーパーでは、安全で不確実な学習方法のフレームワークを紹介します。
針挿入の専門的なデモンストレーションを使用して、拡散ポリシーのアンサンブルモデルをトレーニングします。
アンサンブルモデルを使用して、分散型シナリオを決定するために使用されるポリシーの認識論的不確実性を定量化できます。
これにより、安全でないシナリオが発生した場合、システムは外科医にコントロールをリリースできます。
さらに、予測されるアクションに正式な安全保証を配置するために、モデルなしの制御バリア関数を実装します。
最先端のロボット縫合シミュレーターを使用して、提案されたフレームワークを実験的に評価します。
針を落としたり、カメラを動かしたり、ファントムを移動したりするなど、複数のシナリオを評価します。
学習したポリシーは、これらの摂動に堅牢であり、修正行動と一般化を示しており、分散型シナリオを検出することが可能です。
さらに、制御バリア関数が、安全でない予測の場合に指定された安全セット内に留まるようにアクションを正常に制限することを実証します。
要約(オリジナル)
Robot-Assisted Minimally Invasive Surgery is currently fully manually controlled by a trained surgeon. Automating this has great potential for alleviating issues, e.g., physical strain, highly repetitive tasks, and shortages of trained surgeons. For these reasons, recent works have utilized Artificial Intelligence methods, which show promising adaptability. Despite these advances, there is skepticism of these methods because they lack explainability and robust safety guarantees. This paper presents a framework for a safe, uncertainty-aware learning method. We train an Ensemble Model of Diffusion Policies using expert demonstrations of needle insertion. Using an Ensemble model, we can quantify the policy’s epistemic uncertainty, which is used to determine Out-Of-Distribution scenarios. This allows the system to release control back to the surgeon in the event of an unsafe scenario. Additionally, we implement a model-free Control Barrier Function to place formal safety guarantees on the predicted action. We experimentally evaluate our proposed framework using a state-of-the-art robotic suturing simulator. We evaluate multiple scenarios, such as dropping the needle, moving the camera, and moving the phantom. The learned policy is robust to these perturbations, showing corrective behaviors and generalization, and it is possible to detect Out-Of-Distribution scenarios. We further demonstrate that the Control Barrier Function successfully limits the action to remain within our specified safety set in the case of unsafe predictions.
arxiv情報
著者 | Wilbert Peter Empleo,Yitaek Kim,Hansoul Kim,Thiusius Rajeeth Savarimuthu,Iñigo Iturrate |
発行日 | 2025-05-22 12:31:18+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google