ThermalGaussian: Thermal 3D Gaussian Splatting

要約

サーモグラフィーは、軍やその他の監視カメラのユーザーにとって特に価値があります。
Neural Radiance Fields (NeRF) に基づくいくつかの最近の方法は、熱画像と RGB 画像のセットから 3D で熱シーンを再構成するために提案されています。
ただし、NeRF とは異なり、3D ガウス スプラッティング (3DGS) は、その迅速なトレーニングとリアルタイム レンダリングにより普及しています。
この研究では、RGB および熱モダリティで高品質の画像をレンダリングできる初の熱 3DGS アプローチである ThermalGaussian を提案します。
まず RGB カメラとサーマル カメラを校正して、両方のモダリティが正確に調整されていることを確認します。
次に、登録された画像を使用して、マルチモーダル 3D ガウスを学習します。
単一モダリティの過学習を防ぐために、いくつかのマルチモーダル正則化制約を導入します。
また、熱モダリティの物理的特性に合わせた平滑化制約も開発します。
さらに、手持ち型熱赤外線カメラで撮影した RGBT-Scenes という実世界のデータセットも提供し、熱シーンの再構築に関する将来の研究を促進します。
私たちは包括的な実験を行って、ThermalGaussian が熱画像のフォトリアリスティックなレンダリングを実現し、RGB 画像のレンダリング品質を向上させることを示します。
提案されたマルチモーダル正則化制約により、モデルのストレージ コストも 90\% 削減されました。
コードとデータセットはリリースされます。

要約(オリジナル)

Thermography is especially valuable for the military and other users of surveillance cameras. Some recent methods based on Neural Radiance Fields (NeRF) are proposed to reconstruct the thermal scenes in 3D from a set of thermal and RGB images. However, unlike NeRF, 3D Gaussian splatting (3DGS) prevails due to its rapid training and real-time rendering. In this work, we propose ThermalGaussian, the first thermal 3DGS approach capable of rendering high-quality images in RGB and thermal modalities. We first calibrate the RGB camera and the thermal camera to ensure that both modalities are accurately aligned. Subsequently, we use the registered images to learn the multimodal 3D Gaussians. To prevent the overfitting of any single modality, we introduce several multimodal regularization constraints. We also develop smoothing constraints tailored to the physical characteristics of the thermal modality. Besides, we contribute a real-world dataset named RGBT-Scenes, captured by a hand-hold thermal-infrared camera, facilitating future research on thermal scene reconstruction. We conduct comprehensive experiments to show that ThermalGaussian achieves photorealistic rendering of thermal images and improves the rendering quality of RGB images. With the proposed multimodal regularization constraints, we also reduced the model’s storage cost by 90\%. The code and dataset will be released.

arxiv情報

著者 Rongfeng Lu,Hangyu Chen,Zunjie Zhu,Yuhang Qin,Ming Lu,Le Zhang,Chenggang Yan,Anke Xue
発行日 2024-09-11 11:45:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク