Learning to Plan Maneuverable and Agile Flight Trajectory with Optimization Embedded Networks

要約

近年、エンドツーエンドのフライトナビゲーションにディープニューラルネットワークを活用する研究者が増えている。このアプローチは、従来の手法に存在する知覚とプランニングのギャップを埋めることができるため、モジュール間の遅延をなくすことができ、支持を集めている。しかし、本来のモジュールをブラックボックス的にニューラルネットワークに置き換えるやり方は、システム全体のロバスト性と安定性を低下させる。原理的な説明に欠け、高品質の運動軌道を一貫して生成できないことが多い。さらに、このような手法は、ロボットの運動学的制約を厳密に説明することに苦労することが多く、その結果、満足に実行できない軌道を生成してしまう。本研究では、最適化を組み込んだニューラルネットワークを提案することで、従来の手法とニューラルネットワークの利点を組み合わせる。このネットワークは、動的な実行可能性を確保しつつ、マッピングを必要とせず、視覚入力から高品質の軌道を直接学習することができる。ここでは、深度画像から環境安全領域を直接抽出するために、ディープニューラルネットワークを採用する。その後、軌道最適化における安全制約としてこれらの領域を表現するために、モデルベースのアプローチを採用する。非常に効率的な最適化アルゴリズムの利用可能性を活用することで、我々の手法は、ユーザが定義した様々な制約条件を満たす実現可能な最適解に頑健に収束する。さらに、最適化プロセスを差別化し、ニューラルネットワーク内のレイヤーとして学習できるようにする。このアプローチにより、知覚とプランニングの直接的な相互作用が促進され、最適解が存在する空間領域にネットワークがより集中できるようになる。その結果、生成される軌道の品質と安定性がさらに向上する。

要約(オリジナル)

In recent times, an increasing number of researchers have been devoted to utilizing deep neural networks for end-to-end flight navigation. This approach has gained traction due to its ability to bridge the gap between perception and planning that exists in traditional methods, thereby eliminating delays between modules. However, the practice of replacing original modules with neural networks in a black-box manner diminishes the overall system’s robustness and stability. It lacks principled explanations and often fails to consistently generate high-quality motion trajectories. Furthermore, such methods often struggle to rigorously account for the robot’s kinematic constraints, resulting in the generation of trajectories that cannot be executed satisfactorily. In this work, we combine the advantages of traditional methods and neural networks by proposing an optimization-embedded neural network. This network can learn high-quality trajectories directly from visual inputs without the need of mapping, while ensuring dynamic feasibility. Here, the deep neural network is employed to directly extract environment safety regions from depth images. Subsequently, we employ a model-based approach to represent these regions as safety constraints in trajectory optimization. Leveraging the availability of highly efficient optimization algorithms, our method robustly converges to feasible and optimal solutions that satisfy various user-defined constraints. Moreover, we differentiate the optimization process, allowing it to be trained as a layer within the neural network. This approach facilitates the direct interaction between perception and planning, enabling the network to focus more on the spatial regions where optimal solutions exist. As a result, it further enhances the quality and stability of the generated trajectories.

arxiv情報

著者 Zhichao Han,Long Xu,Fei Gao
発行日 2024-06-03 11:43:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO パーマリンク