要約
熱赤外線 (TIR) イメージングは、困難な屋外環境でのナビゲーションに堅牢な認識を提供しますが、14/16 ビット形式による貧弱なテクスチャと低い画像コントラストの問題に直面しています。
従来の方法では、TIR 画像のコントラストと測光の一貫性を高めるためにさまざまなトーン マッピング方法が利用されていますが、トーン マッピングの選択は、適切に機能するタスクと温度に依存する事前分布を把握しているかどうかに大きく依存します。
この論文では、RAW 14 ビット TIR 画像に対するタスク適応型トーン マッピング アプローチである Thermal Chameleon Network (TCNet) を紹介します。
同じ画像を与えられた場合、TCNet は特定のタスクごとに調整された TIR 画像のさまざまな表現をトーンマップし、ヒューリスティックな画像再スケーリングの前処理や、シーンの温度やタスク固有の特性に関する広範な事前知識への依存を排除します。
TCNet は、計算オーバーヘッドを最小限に抑え、さまざまなタスクの既存のアーキテクチャにモジュールを統合することで、物体検出と単眼奥行き推定全体にわたる汎化パフォーマンスの向上を示します。
プロジェクトページ: https://github.com/donkeymouse/ThermalChameleon
要約(オリジナル)
Thermal Infrared (TIR) imaging provides robust perception for navigating in challenging outdoor environments but faces issues with poor texture and low image contrast due to its 14/16-bit format. Conventional methods utilize various tone-mapping methods to enhance contrast and photometric consistency of TIR images, however, the choice of tone-mapping is largely dependent on knowing the task and temperature dependent priors to work well. In this paper, we present Thermal Chameleon Network (TCNet), a task-adaptive tone-mapping approach for RAW 14-bit TIR images. Given the same image, TCNet tone-maps different representations of TIR images tailored for each specific task, eliminating the heuristic image rescaling preprocessing and reliance on the extensive prior knowledge of the scene temperature or task-specific characteristics. TCNet exhibits improved generalization performance across object detection and monocular depth estimation, with minimal computational overhead and modular integration to existing architectures for various tasks. Project Page: https://github.com/donkeymouse/ThermalChameleon
arxiv情報
著者 | Dong-Guw Lee,Jeongyun Kim,Younggun Cho,Ayoung Kim |
発行日 | 2024-10-24 00:33:26+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google