要約
ロボット手術は急速に発展している分野であり、外科的タスクの自動化から大きな恩恵を受けることができます。
ただし、強化学習(RL)などのトレーニング技術には、実際の外科システムで実行するために一般的に安全で非現実的なタスクの繰り返しが多い必要があります。
これは、シミュレートされた外科環境の必要性を強調します。これは、現実的であるだけでなく、計算上効率的でスケーラブルです。
ロボット手術のための高性能学習環境であるFF-SRL(高速および柔軟な外科的補強学習)を紹介します。
FF-SRLでは、物理シミュレーションとRLポリシートレーニングの両方が単一のGPUに完全に存在します。
これにより、CPUとGPU間のデータ転送に関連する典型的なボトルネックが回避され、学習率が加速されます。
我々の結果は、FF-SRLが、一般的なCPU/GPUシミュレーターと比較して、複雑な組織操作タスクのトレーニング時間を数分まで短縮することを示しています。
このようなスピードアップは、RL技術の実験を促進し、新世代の手術システムの開発に貢献する可能性があります。
この目的のために、コードをコミュニティが公開しています。
要約(オリジナル)
Robotic surgery is a rapidly developing field that can greatly benefit from the automation of surgical tasks. However, training techniques such as Reinforcement Learning (RL) require a high number of task repetitions, which are generally unsafe and impractical to perform on real surgical systems. This stresses the need for simulated surgical environments, which are not only realistic, but also computationally efficient and scalable. We introduce FF-SRL (Fast and Flexible Surgical Reinforcement Learning), a high-performance learning environment for robotic surgery. In FF-SRL both physics simulation and RL policy training reside entirely on a single GPU. This avoids typical bottlenecks associated with data transfer between the CPU and GPU, leading to accelerated learning rates. Our results show that FF-SRL reduces the training time of a complex tissue manipulation task by an order of magnitude, down to a couple of minutes, compared to a common CPU/GPU simulator. Such speed-up may facilitate the experimentation with RL techniques and contribute to the development of new generation of surgical systems. To this end, we make our code publicly available to the community.
arxiv情報
著者 | Diego Dall’Alba,Michał Nasket,Sabina Kaminska,Przemysław Korzeniowski |
発行日 | 2025-03-24 12:19:50+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google