SCoTT: Wireless-Aware Path Planning with Vision Language Models and Strategic Chains-of-Thought

要約

経路計画は、特にロボット工学における多くの実際のアプリケーションにとって複雑な問題です。
ただし、既存のアルゴリズムは本質的に網羅的であり、距離の最小化とともに追加の側面制約が組み込まれると、ますます複雑になります。
この論文では、複雑なワイヤレス対応環境での経路計画を可能にするために、ビジョン言語モデル (VLM) を使用した新しいアプローチを提案します。
この目的を達成するために、軌道の長さを最小限に抑えながら平均パス ゲインしきい値を保証するために、実世界のワイヤレス レイ トレーシング データを含むデジタル ツイン (DT) からの洞察が調査されます。
まず、A* などの従来のアプローチがいくつかのワイヤレス対応拡張機能と比較され、DT 内のすべてのパス ゲインと距離メトリックを完全に考慮した最適な反復動的プログラミング アプローチ (DP-WA*) が導出されます。
これらのベースラインに基づいて、経路計画の代替アシスタントとしての VLM の役割が調査され、戦略的思考連鎖タスク (SCoTT) アプローチが提案されます。
SCoTT は、複雑な計画タスクをいくつかのサブ問題に分割し、高度な CoT プロンプトでそれぞれを解決します。
結果は、SCoTT が DP-WA* と比較して非常に近い平均パス ゲインを達成しながら、同時に一貫して短いパス長を実現していることを示しています。
この結果は、VLM を使用してアルゴリズムの検索スペースを効率的に削減し、実行時間を最大 62\% 節約することで DP-WA* を高速化できることも示しています。
この成果は、さまざまな無線制約下でユーザーの対話を強化し、ラピッドプロトタイピングを加速しながら、複雑なタスクを解決するための有能なアシスタントとして、将来のデジタル システムにおける VLM の可能性を強調しています。

要約(オリジナル)

Path planning is a complex problem for many practical applications, particularly in robotics. Existing algorithms, however, are exhaustive in nature and become increasingly complex when additional side constraints are incorporated alongside distance minimization. In this paper, a novel approach using vision language models (VLMs) is proposed for enabling path planning in complex wireless-aware environments. To this end, insights from a digital twin (DT) with real-world wireless ray tracing data are explored in order to guarantee an average path gain threshold while minimizing the trajectory length. First, traditional approaches such as A* are compared to several wireless-aware extensions, and an optimal iterative dynamic programming approach (DP-WA*) is derived, which fully takes into account all path gains and distance metrics within the DT. On the basis of these baselines, the role of VLMs as an alternative assistant for path planning is investigated, and a strategic chain-of-thought tasking (SCoTT) approach is proposed. SCoTT divides the complex planning task into several subproblems and solves each with advanced CoT prompting. Results show that SCoTT achieves very close average path gains compared to DP-WA* while at the same time yielding consistently shorter path lengths. The results also show that VLMs can be used to accelerate DP-WA* by efficiently reducing the algorithm’s search space and thus saving up to 62\% in execution time. This work underscores the potential of VLMs in future digital systems as capable assistants for solving complex tasks, while enhancing user interaction and accelerating rapid prototyping under diverse wireless constraints.

arxiv情報

著者 Aladin Djuhera,Vlad C. Andrei,Amin Seffo,Holger Boche,Walid Saad
発行日 2024-11-27 10:45:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO, cs.SY, eess.SY パーマリンク