要約
この論文では、Transformer アーキテクチャと Large Language Model (LLM) を備えたニューラル ネットワークに基づいてミッション プランナーを構築するための新しいアプローチを紹介します。
このアプローチは、カメラからのデータのみに基づいて、知覚アルゴリズムを使用せずに移動ロボットのタスクを設定し、そのタスクを正常に実行できる可能性を示しています。
この研究では、移動ロボットの基本動作の 1 つで 50\% 以上の成功率が得られました。
提案されたアプローチは、将来的には空間内でロボットの方向を定めるためのマーキング、LiDAR、ビーコン、その他のツールの使用を排除できる可能性があるため、倉庫物流ロボットの分野では実用的に重要です。
結論として、このアプローチは、任意の種類のロボットおよび任意の数のロボットに拡張できます。
要約(オリジナル)
This paper presents a novel approach to building mission planners based on neural networks with Transformer architecture and Large Language Models (LLMs). This approach demonstrates the possibility of setting a task for a mobile robot and its successful execution without the use of perception algorithms, based only on the data coming from the camera. In this work, a success rate of more than 50\% was obtained for one of the basic actions for mobile robots. The proposed approach is of practical importance in the field of warehouse logistics robots, as in the future it may allow to eliminate the use of markings, LiDARs, beacons and other tools for robot orientation in space. In conclusion, this approach can be scaled for any type of robot and for any number of robots.
arxiv情報
著者 | Vladimir Berman,Artem Bazhenov,Dzmitry Tsetserukou |
発行日 | 2024-11-07 19:34:32+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google