UniLCD: Unified Local-Cloud Decision-Making via Reinforcement Learning

要約

モバイル ロボットなどの具体化されたビジョンベースの実世界システムでは、動的なタスクやコンテキスト全体で動作を最適化するために、エネルギー消費、計算遅延、安全制約の間で慎重なバランスが必要です。
ローカルの計算は制限される傾向があるため、計算をリモート サーバーにオフロードすることで、ローカル リソースを節約しながら、強力で大規模なモデルからの高品質の予測へのアクセスを提供できます。
ただし、その結果として生じる通信と遅延のオーバーヘッドにより、動的で安全性が重要なリアルタイム設定におけるクラウド モデルの有用性が制限されています。
このトレードオフに効果的に対処するために、柔軟なローカルとクラウドのコラボレーションを可能にする新しいハイブリッド推論フレームワークである UniLCD を導入します。
UniLCD は、強化学習と適切なマルチタスク目標によって柔軟なルーティング モジュールを効率的に最適化することにより、セーフティ クリティカルなエンドツーエンド モバイル システムの複数の制約をサポートするように特別に設計されています。
ローカルとクラウドの操作を頻繁かつタイムリーに切り替える必要がある、困難で混雑したナビゲーション タスクを使用して、提案されたアプローチを検証します。
UniLCD は、さまざまな分割コンピューティングおよび早期終了戦略に基づく最先端のベースラインと比較して、全体的なパフォーマンスと効率が 35% 以上向上していることを示しています。

要約(オリジナル)

Embodied vision-based real-world systems, such as mobile robots, require a careful balance between energy consumption, compute latency, and safety constraints to optimize operation across dynamic tasks and contexts. As local computation tends to be restricted, offloading the computation, ie, to a remote server, can save local resources while providing access to high-quality predictions from powerful and large models. However, the resulting communication and latency overhead has led to limited usability of cloud models in dynamic, safety-critical, real-time settings. To effectively address this trade-off, we introduce UniLCD, a novel hybrid inference framework for enabling flexible local-cloud collaboration. By efficiently optimizing a flexible routing module via reinforcement learning and a suitable multi-task objective, UniLCD is specifically designed to support the multiple constraints of safety-critical end-to-end mobile systems. We validate the proposed approach using a challenging, crowded navigation task requiring frequent and timely switching between local and cloud operations. UniLCD demonstrates improved overall performance and efficiency, by over 35% compared to state-of-the-art baselines based on various split computing and early exit strategies.

arxiv情報

著者 Kathakoli Sengupta,Zhongkai Shagguan,Sandesh Bharadwaj,Sanjay Arora,Eshed Ohn-Bar,Renato Mancuso
発行日 2024-09-17 17:59:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク