Human-in-the-loop Embodied Intelligence with Interactive Simulation Environment for Surgical Robot Learning

要約

外科用ロボットの自動化は、外科医、看護師、患者に利益をもたらす大きな可能性を期待して、過去 10 年間で研究の関心を集めてきました。
最近、具現化された AI の学習パラダイムは、さまざまな複雑なタスクの適切な制御ポリシーを学習する有望な能力を実証しており、具現化された AI シミュレーターは、関連する研究者を促進するために不可欠な役割を果たします。
ただし、既存のオープンソースの手術用ロボット用シミュレーターは、物理的な入力デバイスを介した人間の相互作用をまだ十分にサポートしておらず、人間によるデモがポリシー学習にどのように影響するかについての効果的な調査をさらに制限しています。
この論文では、手術ロボット学習用の新しいインタラクティブなシミュレーション プラットフォームを使用して、ヒューマン イン ザ ループの具体化された知能を研究します。
具体的には、以前にリリースされた SurRoL シミュレーターに基づいてプラットフォームを確立し、入力デバイスを介して高品質の人間との対話を可能にするために共同開発されたいくつかの新機能を備えています。
これらにより、さらに効果的な政策学習を実現するために、人間のデモンストレーションを収集し、行動パターンを模倣することを提案します。
設計された新しい機能とタスクを使用してシミュレーション環境の改善を紹介し、インタラクティブな環境を使用して最先端の強化学習アルゴリズムを検証します。
有望な結果が得られ、外科的身体知能に関する将来の研究への道が開かれることを願っています。
私たちのプラットフォームがリリースされ、ウェブサイトで継続的に更新されます: https://med-air.github.io/SurRoL/

要約(オリジナル)

Surgical robot automation has attracted increasing research interest over the past decade, expecting its huge potential to benefit surgeons, nurses and patients. Recently, the learning paradigm of embodied AI has demonstrated promising ability to learn good control policies for various complex tasks, where embodied AI simulators play an essential role to facilitate relevant researchers. However, existing open-sourced simulators for surgical robot are still not sufficiently supporting human interactions through physical input devices, which further limits effective investigations on how human demonstrations would affect policy learning. In this paper, we study human-in-the-loop embodied intelligence with a new interactive simulation platform for surgical robot learning. Specifically, we establish our platform based on our previously released SurRoL simulator with several new features co-developed to allow high-quality human interaction via an input device. With these, we further propose to collect human demonstrations and imitate the action patterns to achieve more effective policy learning. We showcase the improvement of our simulation environment with the designed new features and tasks, and validate state-of-the-art reinforcement learning algorithms using the interactive environment. Promising results are obtained, with which we hope to pave the way for future research on surgical embodied intelligence. Our platform is released and will be continuously updated in the website: https://med-air.github.io/SurRoL/

arxiv情報

著者 Yonghao Long,Wang Wei,Tao Huang,Yuehao Wang,Qi Dou
発行日 2023-01-01 18:05:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO パーマリンク