Research on Inertial Navigation Technology of Unmanned Aerial Vehicles with Integrated Reinforcement Learning Algorithm

要約

まず適切な状態表現とアクション空間を定義し、次にインテリジェント エージェントによって選択されたアクションに基づいて調整メカニズムを設計します。
調整メカニズムは、エージェントの次の状態と報酬値を出力します。
さらに、調整機構は調整された状態と調整されていない状態の間の誤差を計算します。
さらに、インテリジェント エージェントは、状態と報酬値を含む取得したエクスペリエンス サンプルをバッファに保存し、各反復中にエクスペリエンスを再生して、環境の動的な特性を学習します。
改良されたアルゴリズムを DQM アルゴリズムと名付けます。
実験結果は、私たちが提案したアルゴリズムを使用したインテリジェントエージェントが、動的環境における慣性ナビゲーションの累積エラーを効果的に削減することを示しています。
私たちの研究は、無人航空機の自律航行を実現するための基礎を提供しますが、まだ大幅な最適化の余地があります。
さらなる研究には、シミュレートされた環境での無人航空機のテスト、現実世界の環境での無人航空機のテスト、報酬関数の設計の最適化、収束速度とパフォーマンスを向上させるアルゴリズムのワークフローの改善、アルゴリズムの汎化能力の強化などが含まれます。

要約(オリジナル)

We first define appropriate state representation and action space, and then design an adjustment mechanism based on the actions selected by the intelligent agent. The adjustment mechanism outputs the next state and reward value of the agent. Additionally, the adjustment mechanism calculates the error between the adjusted state and the unadjusted state. Furthermore, the intelligent agent stores the acquired experience samples containing states and reward values in a buffer and replays the experiences during each iteration to learn the dynamic characteristics of the environment. We name the improved algorithm as the DQM algorithm. Experimental results demonstrate that the intelligent agent using our proposed algorithm effectively reduces the accumulated errors of inertial navigation in dynamic environments. Although our research provides a basis for achieving autonomous navigation of unmanned aerial vehicles, there is still room for significant optimization. Further research can include testing unmanned aerial vehicles in simulated environments, testing unmanned aerial vehicles in real-world environments, optimizing the design of reward functions, improving the algorithm workflow to enhance convergence speed and performance, and enhancing the algorithm’s generalization ability.

arxiv情報

著者 Longcheng Guo
発行日 2023-07-26 08:41:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク