Navigation of micro-robot swarms for targeted delivery using reinforcement learning

要約

マイクロロボティクスは、標的薬物送達に焦点を当てた多くの医療治療に対する有望な技術ソリューションとして急速に浮上しています。
それらは、その微小なサイズのために個々の制御がほとんど不可能な群れで作業する場合に効果的です。
したがって、単一のコントローラーで多数のロボットを制御することが重要であり、人工知能はこのタスクを正常に実行するのに役立ちます。
この研究では、強化学習 (RL) アルゴリズムである近接ポリシー最適化 (PPO) とロバスト ポリシー最適化 (RPO) を使用して、向きによって制御される流体力学的効果の下で 4、9、16 台のマイクロスイマーの群れを円形の吸収に向けてナビゲートします。
目標。
限られた状態情報のシナリオで PPO と RPO の両方のパフォーマンスを調べ、ランダムなターゲットの場所とサイズに対する堅牢性もテストします。
私たちはカリキュラム学習を使用してパフォーマンスを向上させ、25 人の水泳選手の群れをナビゲートし、群れを操縦して RL モデルの操縦能力を実証する学習でも同じことを実証します。

要約(オリジナル)

Micro robotics is quickly emerging to be a promising technological solution to many medical treatments with focus on targeted drug delivery. They are effective when working in swarms whose individual control is mostly infeasible owing to their minute size. Controlling a number of robots with a single controller is thus important and artificial intelligence can help us perform this task successfully. In this work, we use the Reinforcement Learning (RL) algorithms Proximal Policy Optimization (PPO) and Robust Policy Optimization (RPO) to navigate a swarm of 4, 9 and 16 microswimmers under hydrodynamic effects, controlled by their orientation, towards a circular absorbing target. We look at both PPO and RPO performances with limited state information scenarios and also test their robustness for random target location and size. We use curriculum learning to improve upon the performance and demonstrate the same in learning to navigate a swarm of 25 swimmers and steering the swarm to exemplify the manoeuvring capabilities of the RL model.

arxiv情報

著者 Akshatha Jagadish,Manoj Varma
発行日 2023-06-30 12:17:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク