Dynamic Collaborative Material Distribution System for Intelligent Robots In Smart Manufacturing

要約

複数のロボットのコラボレーションと相互作用は、スマート製造の不可欠な側面になっています。
効果的な計画と管理は、エネルギーの節約を達成し、全体的なコストを最小限に抑える上で重要な役割を果たします。
このペーパーでは、特にスマートマニュファクチャリングにおける複数のインテリジェントロボットの材料分布ケースを使用して、リアルタイムの動的複数のソース(DMS-SD)ナビゲーションの問題に対処します。
\ cite {xiao2022efficient}などの列挙されたソリューションは、可能な限り多くの最適または最適なソリューションを生成することで問題に取り組みますが、以前の経験からの方法を学習しません。
その結果、これらの方法は大規模なマップで結果を計算するのにかなりの時間がかかる場合があり、リアルタイム操作を非現実的にします。
この課題を克服するために、DMS-SD問題に対処するための軽量の深い強化学習(DRL)方法を提案します。
提案されたDRLメソッドは、効率的にトレーニングされ、設計されたターゲットガイド付き報酬機能を使用して最適なソリューションに迅速に収束します。
よく訓練されたDRLモデルは、次の動きの計算時間をミリ秒レベルまで大幅に削減し、列挙された溶液と比較して実験で最大100倍の時間を改善します。
さらに、訓練されたDRLモデルは、モノのインターネットデバイスや携帯電話など、限られた計算リソースのみを必要とするスマートマニュアルの軽量デバイスに簡単に展開できます。

要約(オリジナル)

The collaboration and interaction of multiple robots have become integral aspects of smart manufacturing. Effective planning and management play a crucial role in achieving energy savings and minimising overall costs. This paper addresses the real-time Dynamic Multiple Sources to Single Destination (DMS-SD) navigation problem, particularly with a material distribution case for multiple intelligent robots in smart manufacturing. Enumerated solutions, such as in \cite{xiao2022efficient}, tackle the problem by generating as many optimal or near-optimal solutions as possible but do not learn patterns from the previous experience, whereas the method in \cite{xiao2023collaborative} only uses limited information from the earlier trajectories. Consequently, these methods may take a considerable amount of time to compute results on large maps, rendering real-time operations impractical. To overcome this challenge, we propose a lightweight Deep Reinforcement Learning (DRL) method to address the DMS-SD problem. The proposed DRL method can be efficiently trained and rapidly converges to the optimal solution using the designed target-guided reward function. A well-trained DRL model significantly reduces the computation time for the next movement to a millisecond level, which improves the time up to 100 times in our experiments compared to the enumerated solutions. Moreover, the trained DRL model can be easily deployed on lightweight devices in smart manufacturing, such as Internet of Things devices and mobile phones, which only require limited computational resources.

arxiv情報

著者 Ziren Xiao,Ruxin Xiao,Chang Liu,Xinheng Wang
発行日 2025-06-13 12:37:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク