要約
強化学習はロボット制御の分野で重要性を増しており、シミュレーションはこのプロセスで重要な役割を果たしています。
無人航空機 (UAV、ドローン) においても、このアプローチに関連する科学論文の出版数が増加しています。
この作品では、回転する LiDAR センサーからのデータに基づいて、自律ドローン制御システムが (その座標系に従って) 前方に飛行し、森で遭遇した木々を通過するように準備されました。
これを準備するために、強化学習 (RL) の一例である近接ポリシー最適化 (PPO) アルゴリズムが使用されました。
この目的のために、Python 言語のカスタム シミュレーターが開発されました。
ロボット オペレーティング システム (ROS) と統合された Gazebo 環境は、結果として得られる制御アルゴリズムのテストにも使用されました。
最後に、準備されたソリューションが Nvidia Jetson Nano eGPU に実装され、実際のテスト シナリオで検証されました。
その間、ドローンは設定されたタスクを正常に完了し、繰り返し木を避けて森の中を飛行することができました。
要約(オリジナル)
Reinforcement learning is of increasing importance in the field of robot control and simulation plays a~key role in this process. In the unmanned aerial vehicles (UAVs, drones), there is also an increase in the number of published scientific papers involving this approach. In this work, an autonomous drone control system was prepared to fly forward (according to its coordinates system) and pass the trees encountered in the forest based on the data from a rotating LiDAR sensor. The Proximal Policy Optimization (PPO) algorithm, an example of reinforcement learning (RL), was used to prepare it. A custom simulator in the Python language was developed for this purpose. The Gazebo environment, integrated with the Robot Operating System (ROS), was also used to test the resulting control algorithm. Finally, the prepared solution was implemented in the Nvidia Jetson Nano eGPU and verified in the real tests scenarios. During them, the drone successfully completed the set task and was able to repeatably avoid trees and fly through the forest.
arxiv情報
著者 | Pawel Miera,Hubert Szolc,Tomasz Kryjak |
発行日 | 2023-07-26 17:23:33+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google