要約
学習ベースの自律運転には、複雑なトラフィックにおける多様な知識を継続的に統合する必要がありますが、既存の方法は適応能力に大きな制限を示します。
このギャップに対処するには、動的な調整を通じて進化する環境相互作用を通じて継続的な適応を可能にする自律運転システムが必要です。
これは、システムの適応性を向上させるための継続的な学習能力を強化する必要性を強調しています。
これらの課題に対処するために、このペーパーでは、データ集約のための補強学習と監視された学習を統合することによって達成される動的環境の変動への適応を促進する動的なプログレッシブ最適化フレームワークを紹介します。
このフレームワークに基づいて、プログレッシブエキスパート(MOPE)ネットワークの混合を提案します。
提案された方法は、各タスクの明確な特性に基づいて複数のエキスパートモデルを選択的にアクティブにし、ネットワークアーキテクチャを徐々に改良して、新しいタスクへの適応を促進します。
シミュレーション結果は、MOPEモデルが動作のクローニング方法を上回り、複雑な都市道路環境で最大7.8%のパフォーマンス改善を達成することを示しています。
要約(オリジナル)
Learning-based autonomous driving requires continuous integration of diverse knowledge in complex traffic , yet existing methods exhibit significant limitations in adaptive capabilities. Addressing this gap demands autonomous driving systems that enable continual adaptation through dynamic adjustments to evolving environmental interactions. This underscores the necessity for enhanced continual learning capabilities to improve system adaptability. To address these challenges, the paper introduces a dynamic progressive optimization framework that facilitates adaptation to variations in dynamic environments, achieved by integrating reinforcement learning and supervised learning for data aggregation. Building on this framework, we propose the Mixture of Progressive Experts (MoPE) network. The proposed method selectively activates multiple expert models based on the distinct characteristics of each task and progressively refines the network architecture to facilitate adaptation to new tasks. Simulation results show that the MoPE model outperforms behavior cloning methods, achieving up to a 7.8% performance improvement in intricate urban road environments.
arxiv情報
著者 | Yixin Cui,Shuo Yang,Chi Wan,Xincheng Li,Jiaming Xing,Yuanjian Zhang,Yanjun Huang,Hong Chen |
発行日 | 2025-02-17 04:48:56+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google