Trajectory Optimization Under Stochastic Dynamics Leveraging Maximum Mean Discrepancy


通常、このようなアプローチは、$ \ tilde {n} $の乱れたロールアウトを公称ダイナミクスの周りに計算して、一連の制御コマンドに関連する衝突リスクを推定することによって機能します。
まず、統計情報をより大きなロールアウトのセットからサンプルサイズ$ n << \ tilde {n} $の縮小セットに蒸留するアルゴリズムを開発します。 したがって、$ \ Tilde {n} $の代わりに$ n $ lolloutsを使用して衝突リスクを推定します。 第二に、縮小セットに含まれる蒸留統計情報を活用できる衝突リスクの新しい代理を策定します。 Kernel Hilbertスペース(RKHS)と最大平均矛盾(MMD)の再現に埋め込まれた分布を使用して、両方のアルゴリズム貢献を形式化します。 広範なベンチマークを実行して、MMDベースのアプローチが、条件付きValue-ATリスク(CVAR)ベースの衝突リスク推定値を使用して、既存のベースラインよりも低いサンプルレジームでより安全な軌跡につながることを実証します。


This paper addresses sampling-based trajectory optimization for risk-aware navigation under stochastic dynamics. Typically such approaches operate by computing $\tilde{N}$ perturbed rollouts around the nominal dynamics to estimate the collision risk associated with a sequence of control commands. We consider a setting where it is expensive to estimate risk using perturbed rollouts, for example, due to expensive collision-checks. We put forward two key contributions. First, we develop an algorithm that distills the statistical information from a larger set of rollouts to a reduced-set with sample size $N<<\tilde{N}$. Consequently, we estimate collision risk using just $N$ rollouts instead of $\tilde{N}$. Second, we formulate a novel surrogate for the collision risk that can leverage the distilled statistical information contained in the reduced-set. We formalize both algorithmic contributions using distribution embedding in Reproducing Kernel Hilbert Space (RKHS) and Maximum Mean Discrepancy (MMD). We perform extensive benchmarking to demonstrate that our MMD-based approach leads to safer trajectories at low sample regime than existing baselines using Conditional Value-at Risk (CVaR) based collision risk estimate.


著者 Basant Sharma,Arun Kumar Singh
発行日 2025-01-31 11:17:19+00:00
カテゴリー: cs.RO