RL-based Variable Horizon Model Predictive Control of Multi-Robot Systems using Versatile On-Demand Collision Avoidance

要約

マルチロボット システムは、監視から協調的なペイロード輸送に至るまで幅広い用途があるため、近年非常に人気が高まっています。
モデル予測制御 (MPC) は、プレビュー機能と制約を簡単に処理できる機能があるため、マルチロボット制御用の有望なコントローラーです。
MPC のパフォーマンスは多くのパラメーターに大きく依存しますが、その中でも予測範囲が主な要因です。
予測範囲を限界を超えて拡大すると、計算コストが大幅に増加します。
予測範囲の値の調整には非常に時間がかかる場合があり、タスクごとに調整プロセスを繰り返す必要があります。
さらに、タスク全体に固定のホライズンを使用する代わりに、タイム ステップごとにロボットごとに異なる予測ホライズンを使用できれば、パフォーマンスと計算コストのより良いバランスを確立できます。
さらに、複数のロボットに対するこのような可変予測ホライズン MPC では、オンデマンドの衝突回避が重要な要件になります。
可変ホライズンモデル予測制御に準拠する多用途オンデマンド衝突回避(VODCA)戦略を提案します。
また、Soft Actor-Critic (SAC) RL アルゴリズムを使用して、ロボットの状態の関数としてマルチロボット システムの予測範囲を学習するためのフレームワークも紹介します。
結果は、さまざまなマルチロボット タスクについて図示され、数値的に検証されます。

要約(オリジナル)

Multi-robot systems have become very popular in recent years because of their wide spectrum of applications, ranging from surveillance to cooperative payload transportation. Model Predictive Control (MPC) is a promising controller for multi-robot control because of its preview capability and ability to handle constraints easily. The performance of the MPC widely depends on many parameters, among which the prediction horizon is the major contributor. Increasing the prediction horizon beyond a limit drastically increases the computation cost. Tuning the value of the prediction horizon can be very time-consuming, and the tuning process must be repeated for every task. Moreover, instead of using a fixed horizon for an entire task, a better balance between performance and computation cost can be established if different prediction horizons can be employed for every robot at each time step. Further, for such variable prediction horizon MPC for multiple robots, on-demand collision avoidance is the key requirement. We propose Versatile On-demand Collision Avoidance (VODCA) strategy to comply with the variable horizon model predictive control. We also present a framework for learning the prediction horizon for the multi-robot system as a function of the states of the robots using the Soft Actor-Critic (SAC) RL algorithm. The results are illustrated and validated numerically for different multi-robot tasks.

arxiv情報

著者 Shreyash Gupta,Abhinav Kumar,Niladri S. Tripathy,Suril V. Shah
発行日 2023-08-14 11:05:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク