要約
部分微分方程式(PDE)に制約された制御のための深い学習の適用は、注目を集めています。
ただし、既存の方法は、現実世界のアプリケーションでは安全要件が重要であるとは考えられません。
この制限に対処するために、PDE制御の安全な拡散モデル(SafeDiffCon)を提案します。これにより、モデルの不確実性の定量化として不確実性分位が導入され、トレーニング後の段階と推論段階の両方を通じて安全制約の下で最適な制御を実現します。
第一に、私たちのアプローチは、事前に訓練された拡散モデルを導き出し、適合予測を使用して推定された不確実性分位を組み込んだ、再重量化された拡散損失を介して改善された制御目標を達成しながら、安全性の制約をよりよく満たす制御シーケンスを生成します。
第二に、推論中、拡散モデルは、推定された不確実性分位を同時に統合しながら、コントロールターゲットに条件付けられた、反復ガイダンスと微調整を通じて、その生成プロセスとパラメーターの両方を動的に調整します。
SafeDiffConを3つの制御タスクで評価します:1Dハンバーガーの方程式、2D非圧縮性液、および制御された核融合問題。
結果は、SafediffConがすべての安全上の制約を満たす唯一の方法であることを示していますが、他の古典的および深い学習ベースラインは失敗します。
さらに、安全上の制約を順守しながら、SafeDiffConは最高の制御パフォーマンスを達成します。
要約(オリジナル)
The application of deep learning for partial differential equation (PDE)-constrained control is gaining increasing attention. However, existing methods rarely consider safety requirements crucial in real-world applications. To address this limitation, we propose Safe Diffusion Models for PDE Control (SafeDiffCon), which introduce the uncertainty quantile as model uncertainty quantification to achieve optimal control under safety constraints through both post-training and inference phases. Firstly, our approach post-trains a pre-trained diffusion model to generate control sequences that better satisfy safety constraints while achieving improved control objectives via a reweighted diffusion loss, which incorporates the uncertainty quantile estimated using conformal prediction. Secondly, during inference, the diffusion model dynamically adjusts both its generation process and parameters through iterative guidance and fine-tuning, conditioned on control targets while simultaneously integrating the estimated uncertainty quantile. We evaluate SafeDiffCon on three control tasks: 1D Burgers’ equation, 2D incompressible fluid, and controlled nuclear fusion problem. Results demonstrate that SafeDiffCon is the only method that satisfies all safety constraints, whereas other classical and deep learning baselines fail. Furthermore, while adhering to safety constraints, SafeDiffCon achieves the best control performance.
arxiv情報
著者 | Peiyan Hu,Xiaowei Qian,Wenhao Deng,Rui Wang,Haodong Feng,Ruiqi Feng,Tao Zhang,Long Wei,Yue Wang,Zhi-Ming Ma,Tailin Wu |
発行日 | 2025-05-15 15:00:10+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google