Word2Wave: Language Driven Mission Programming for Efficient Subsea Deployments of Marine Robots


この論文では、自律型水中ビークル (AUV) の動的ミッション プログラミングのための言語ベースのインターフェイスの設計と開発について検討します。
提案された「Word2Wave」(W2W) フレームワークにより、遠隔海底ミッション用の AUV の対話型プログラミングとパラメータ設定が可能になります。
W2W フレームワークには次のものが含まれます。(i) 言語とミッションを効率的にマッピングするための一連の新しい言語ルールとコマンド構造。
(ii) トレーニング データ生成のための GPT ベースのプロンプト エンジニアリング モジュール。
(iii) 人間の音声またはテキストからミッション コマンドを生成するための小規模言語モデル (SLM) ベースのシーケンスツーシーケンス学習パイプライン。
(iv) 2D ミッション マップの視覚化とヒューマン マシン インターフェイスのための新しいユーザー インターフェイス。
提案された学習パイプラインは、処理された言語データから言語とミッションのマッピングを効果的に学習できる T5-Small という名前の SLM を適応させ、堅牢で効率的なパフォーマンスを提供します。
最先端のベンチマーク評価に加えて、市販の AUV プログラミング インターフェイスに対する W2W の有効性を実証するためにユーザー インタラクション調査を実施します。
参加者全体で、W2W ベースのプログラミングでは、従来のインターフェイスと比較して、ミッション プログラミングに必要な時間は 10% 未満でした。
ユーザビリティ スコアは 76.25 で、海中ミッション プログラミングにとってよりシンプルで自然なパラダイムであると考えられています。
W2W は、効率的な海中配備のためのハンズフリー AUV ミッション プログラミングに関する将来有望な研究の機会を切り開きます。


This paper explores the design and development of a language-based interface for dynamic mission programming of autonomous underwater vehicles (AUVs). The proposed ‘Word2Wave’ (W2W) framework enables interactive programming and parameter configuration of AUVs for remote subsea missions. The W2W framework includes: (i) a set of novel language rules and command structures for efficient language-to-mission mapping; (ii) a GPT-based prompt engineering module for training data generation; (iii) a small language model (SLM)-based sequence-to-sequence learning pipeline for mission command generation from human speech or text; and (iv) a novel user interface for 2D mission map visualization and human-machine interfacing. The proposed learning pipeline adapts an SLM named T5-Small that can learn language-to-mission mapping from processed language data effectively, providing robust and efficient performance. In addition to a benchmark evaluation with state-of-the-art, we conduct a user interaction study to demonstrate the effectiveness of W2W over commercial AUV programming interfaces. Across participants, W2W-based programming required less than 10% time for mission programming compared to traditional interfaces; it is deemed to be a simpler and more natural paradigm for subsea mission programming with a usability score of 76.25. W2W opens up promising future research opportunities on hands-free AUV mission programming for efficient subsea deployments.


著者 Ruo Chen,David Blow,Adnan Abdullah,Md Jahidul Islam
発行日 2024-09-27 02:42:55+00:00
