Trajectory Generation, Control, and Safety with Denoising Diffusion Probabilistic Models


ノイズ除去拡散確率モデル (DDPM) に基づいた物理システムのセーフティ クリティカルな最適制御のためのフレームワークを紹介します。
望ましい安全制約をエンコードするコントロール バリア ファンクション (CBF) のテクノロジーは、DDPM と組み合わせて使用​​され、CBF ベースのガイド付きサンプリング手順を通じて軌道のノイズを反復的に除去することでアクションを計画します。


We present a framework for safety-critical optimal control of physical systems based on denoising diffusion probabilistic models (DDPMs). The technology of control barrier functions (CBFs), encoding desired safety constraints, is used in combination with DDPMs to plan actions by iteratively denoising trajectories through a CBF-based guided sampling procedure. At the same time, the generated trajectories are also guided to maximize a future cumulative reward representing a specific task to be optimally executed. The proposed scheme can be seen as an offline and model-based reinforcement learning algorithm resembling in its functionalities a model-predictive control optimization scheme with receding horizon in which the selected actions lead to optimal and safe trajectories.


著者 Nicolò Botteghi,Federico Califano,Mannes Poel,Christoph Brune
発行日 2023-06-27 14:36:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.RO パーマリンク