RE-POSE: Synergizing Reinforcement Learning-Based Partitioning and Offloading for Edge Object Detection

要約

物体検出は、自動運転やセキュリティからスマートシティに至るまで、幅広い用途でスマートビデオ分析において重要な役割を果たします。
ただし、エッジ デバイスでリアルタイムの物体検出を実現するには、限られた計算リソースと、特に高解像度ビデオを処理する場合のディープ ニューラル ネットワーク (DNN) ベースの検出モデルの高い要求により、大きな課題が生じます。
入力ダウンサンプリングやネットワーク アップスケーリングなどの従来の戦略では、パフォーマンスを向上させるために検出精度が犠牲になったり、推論遅延が増大したりすることがよくあります。
これらの問題に対処するために、このホワイト ペーパーでは、リソースに制約のあるエッジ環境における精度と遅延のトレードオフを最適化するように設計された強化学習 (RL) 駆動のパーティショニングおよびエッジ オフロード フレームワークである RE-POSE を紹介します。
私たちのアプローチは、オブジェクトの分布と DNN の計算特性に基づいてビデオ フレームを不均一なブロックに分割する RL ベースの動的クラスタリング アルゴリズム (RL-DCA) を特徴としています。
さらに、並列エッジ オフロード スキームが実装され、これらのブロックを複数のエッジ サーバーに分散して同時処理が可能になります。
実験による評価では、RE-POSE が既存の方法を超えて検出精度を大幅に向上させ、推論遅延を短縮することが示されています。

要約(オリジナル)

Object detection plays a crucial role in smart video analysis, with applications ranging from autonomous driving and security to smart cities. However, achieving real-time object detection on edge devices presents significant challenges due to their limited computational resources and the high demands of deep neural network (DNN)-based detection models, particularly when processing high-resolution video. Conventional strategies, such as input down-sampling and network up-scaling, often compromise detection accuracy for faster performance or lead to higher inference latency. To address these issues, this paper introduces RE-POSE, a Reinforcement Learning (RL)-Driven Partitioning and Edge Offloading framework designed to optimize the accuracy-latency trade-off in resource-constrained edge environments. Our approach features an RL-Based Dynamic Clustering Algorithm (RL-DCA) that partitions video frames into non-uniform blocks based on object distribution and the computational characteristics of DNNs. Furthermore, a parallel edge offloading scheme is implemented to distribute these blocks across multiple edge servers for concurrent processing. Experimental evaluations show that RE-POSE significantly enhances detection accuracy and reduces inference latency, surpassing existing methods.

arxiv情報

著者 Jianrui Shi,Yong Zhao,Zeyang Cui,Xiaoming Shen,Minhang Zeng,Xiaojie Liu
発行日 2025-01-16 10:56:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.DC パーマリンク