TACO: General Acrobatic Flight Control via Target-and-Command-Oriented Reinforcement Learning

要約

アクロバティックな飛行制御は広範囲に研究されていますが、既存の方法の重要な制限の1つは、通常、特定の操作タスクに制限されており、フライトパターンパラメーターをオンラインで変更できないことです。
この作業では、ターゲットとコマンド指向の強化学習(TACO)フレームワークを提案します。これは、異なる操作タスクを統一された方法で処理し、オンラインパラメーターの変更を可能にすることができます。
さらに、ポリシーの時間的および空間的な滑らかさ、独立性、および対称性を高めるために、入出力の再スケーリングを備えたスペクトル正規化方法を提案し、それによりSIMからリアルのギャップを克服します。
大規模なシミュレーションと現実世界の実験を通じてTACOアプローチを検証し、高速循環フライトと連続的なマルチフリップを達成する能力を実証します。

要約(オリジナル)

Although acrobatic flight control has been studied extensively, one key limitation of the existing methods is that they are usually restricted to specific maneuver tasks and cannot change flight pattern parameters online. In this work, we propose a target-and-command-oriented reinforcement learning (TACO) framework, which can handle different maneuver tasks in a unified way and allows online parameter changes. Additionally, we propose a spectral normalization method with input-output rescaling to enhance the policy’s temporal and spatial smoothness, independence, and symmetry, thereby overcoming the sim-to-real gap. We validate the TACO approach through extensive simulation and real-world experiments, demonstrating its capability to achieve high-speed circular flights and continuous multi-flips.

arxiv情報

著者 Zikang Yin,Canlun Zheng,Shiliang Guo,Zhikun Wang,Shiyu Zhao
発行日 2025-03-07 06:42:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク