PID: Physics-Informed Diffusion Model for Infrared Image Generation

要約

赤外線イメージング技術は、視界が悪い状況でも信頼性の高いセンシング能力を備えているため大きな注目を集めており、豊富な RGB 画像を赤外線画像に変換するための多くの研究が行われています。
しかし、既存の画像変換方法のほとんどは、赤外線画像を文体のバリエーションとして扱い、基礎となる物理法則を無視しているため、実際の応用が制限されています。
これらの問題に対処するために、RGB 画像を物理法則に準拠した赤外線画像に変換するための PID (Physics-Informed Diffusion) モデルを提案します。
私たちの方法では、拡散モデルの反復最適化を活用し、トレーニング中の赤外線の法則の事前知識に基づく強力な物理的制約を組み込んでいます。
このアプローチにより、追加のトレーニング パラメータを増やすことなく、変換された赤外線画像と実際の赤外線領域の間の類似性が強化されます。
実験結果は、PID が既存の最先端の方法よりも大幅に優れていることを示しています。
私たちのコードは https://github.com/fangyuanmao/PID で入手できます。

要約(オリジナル)

Infrared imaging technology has gained significant attention for its reliable sensing ability in low visibility conditions, prompting many studies to convert the abundant RGB images to infrared images. However, most existing image translation methods treat infrared images as a stylistic variation, neglecting the underlying physical laws, which limits their practical application. To address these issues, we propose a Physics-Informed Diffusion (PID) model for translating RGB images to infrared images that adhere to physical laws. Our method leverages the iterative optimization of the diffusion model and incorporates strong physical constraints based on prior knowledge of infrared laws during training. This approach enhances the similarity between translated infrared images and the real infrared domain without increasing extra training parameters. Experimental results demonstrate that PID significantly outperforms existing state-of-the-art methods. Our code is available at https://github.com/fangyuanmao/PID.

arxiv情報

著者 Fangyuan Mao,Jilin Mei,Shun Lu,Fuyang Liu,Liang Chen,Fangzhou Zhao,Yu Hu
発行日 2024-07-12 14:32:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク