PER-DPP Sampling Framework and Its Application in Path Planning

要約

インテリジェントモバイルシステムの自律的なナビゲーションは、人工知能駆動型のロボット工学の中でコアリサーチの焦点を表しています。
現代の経路計画は、動的な環境応答性と多目的タスクのスケーラビリティの制約に直面し、成長するインテリジェントな運用要件に対処する能力を制限します。
適応環境相互作用と自己最適化における独自の強みを活用する意思決定中心の強化学習フレームワークは、高度な制御システムの研究で顕著になりました。
この調査では、補強学習経験のリプレイメカニズムにおけるサンプルの均一性の課題に対処するための方法論的な改善を導入します。
ダイバーシティ評価のために決定因子ポイントプロセス(DPP)を組み込むことにより、適応選択プロトコルを使用してデュアル基準サンプリングフレームワークを開発します。
このアプローチは、アルゴリズムの相互運用性を維持しながら、従来の優先体験リプレイ(PER)システムの表現バイアスを解決し、動的な運用シナリオの決定最適化を改善します。
重要な貢献は次のとおりです。優先順位のシーケンスと多様性の最大化を組み合わせたハイブリッドサンプリングパラダイム(PER-DPP)を開発します。
2Dナビゲーションシナリオの比較シミュレーションは、弾性ステップサイズコンポーネントが一時的に初期収束速度を遅延させるが、DPPごとの統合により最終段階の最適化を相乗的に強化することを示しています。
合成された方法は、最適化された長さの効率と方向安定性を備えたナビゲーションパスを生成します。

要約(オリジナル)

Autonomous navigation in intelligent mobile systems represents a core research focus within artificial intelligence-driven robotics. Contemporary path planning approaches face constraints in dynamic environmental responsiveness and multi-objective task scalability, limiting their capacity to address growing intelligent operation requirements. Decision-centric reinforcement learning frameworks, capitalizing on their unique strengths in adaptive environmental interaction and self-optimization, have gained prominence in advanced control system research. This investigation introduces methodological improvements to address sample homogeneity challenges in reinforcement learning experience replay mechanisms. By incorporating determinant point processes (DPP) for diversity assessment, we develop a dual-criteria sampling framework with adaptive selection protocols. This approach resolves representation bias in conventional prioritized experience replay (PER) systems while preserving algorithmic interoperability, offering improved decision optimization for dynamic operational scenarios. Key contributions comprise: Develop a hybrid sampling paradigm (PER-DPP) combining priority sequencing with diversity maximization.Based on this,create an integrated optimization scheme (PER-DPP-Elastic DQN) merging diversity-aware sampling with adaptive step-size regulation. Comparative simulations in 2D navigation scenarios demonstrate that the elastic step-size component temporarily delays initial convergence speed but synergistically enhances final-stage optimization with PER-DPP integration. The synthesized method generates navigation paths with optimized length efficiency and directional stability.

arxiv情報

著者 Junzhe Wang
発行日 2025-03-10 14:58:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO, math.OC パーマリンク