要約
このペーパーでは、効率的で信頼性の高い無人航空機(UAV)ラストマイル配達のために、生成された前提条件の変圧器(GPT)と補強学習(RL)を統合する2層のフレームワークであるSafeGPTを提案します。
提案された設計では、グローバルGPTモジュールはセクターの割り当てなどの高レベルのタスクを割り当て、デバイス上のGPTはリアルタイムのローカルルート計画を管理します。
RLベースの安全フィルターは、各GPTの決定を監視し、バッテリーの枯渇や訪問の重複につながる可能性のある安全でないアクションをオーバーライドし、幻覚を効果的に軽減します。
さらに、デュアルリプレイバッファーメカニズムは、GPTモジュールとRLエージェントの両方が時間の経過とともに戦略を改良するのに役立ちます。
シミュレーション結果は、SafeGPTがGPTのみのベースラインと比較してより高い配信成功率を達成し、バッテリーの消費と移動距離を大幅に削減することを示しています。
これらの調査結果は、GPTベースのセマンティック推論と正式な安全保証を組み合わせることの有効性を検証し、堅牢でエネルギー効率の高いUAVロジスティクスのための実行可能なソリューションを提供します。
要約(オリジナル)
This paper proposes SafeGPT, a two-tiered framework that integrates generative pretrained transformers (GPTs) with reinforcement learning (RL) for efficient and reliable unmanned aerial vehicle (UAV) last-mile deliveries. In the proposed design, a Global GPT module assigns high-level tasks such as sector allocation, while an On-Device GPT manages real-time local route planning. An RL-based safety filter monitors each GPT decision and overrides unsafe actions that could lead to battery depletion or duplicate visits, effectively mitigating hallucinations. Furthermore, a dual replay buffer mechanism helps both the GPT modules and the RL agent refine their strategies over time. Simulation results demonstrate that SafeGPT achieves higher delivery success rates compared to a GPT-only baseline, while substantially reducing battery consumption and travel distance. These findings validate the efficacy of combining GPT-based semantic reasoning with formal safety guarantees, contributing a viable solution for robust and energy-efficient UAV logistics.
arxiv情報
著者 | Hyojun Ahn,Seungcheol Oh,Gyu Seon Kim,Soyi Jung,Soohyun Park,Joongheon Kim |
発行日 | 2025-04-15 03:21:08+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google