要約
この研究は、転送学習技術を使用した低解像度の熱画像におけるヒトキーポイント検出に対する新しいアプローチを提示します。
熱画像コンピュータービジョンでタイムアップアンドゴー(タグ)テストの最初のアプリケーションを導入し、モビリティ評価のための新しいパラダイムを確立します。
この方法では、潜在的な表現アライメントとヒートマップの精度のバランスをとる複合損失関数を使用してトレーニングされたMobileNETV3-SMALLエンコーダーとVitsposeデコーダーを活用します。
このモデルは、CoCo Keypoint検出チャレンジのオブジェクトキーポイント類似性(OKS)メトリックを使用して評価されました。
提案されたモデルは、それぞれ0.861、0.942、および0.887のAP、AP50、およびAP75スコアでより良いパフォーマンスを達成し、Mask R-CNNやVitops-Baseなどの従来の監視された学習アプローチを上回ります。
さらに、我々のモデルは、パラメーターカウントとフロップの観点から優れた計算効率を示しています。
この研究は、モビリティ評価とリハビリテーションモニタリングにおける熱イメージングの将来の臨床応用のための強固な基盤となっています。
要約(オリジナル)
This study presents a novel approach to human keypoint detection in low-resolution thermal images using transfer learning techniques. We introduce the first application of the Timed Up and Go (TUG) test in thermal image computer vision, establishing a new paradigm for mobility assessment. Our method leverages a MobileNetV3-Small encoder and a ViTPose decoder, trained using a composite loss function that balances latent representation alignment and heatmap accuracy. The model was evaluated using the Object Keypoint Similarity (OKS) metric from the COCO Keypoint Detection Challenge. The proposed model achieves better performance with AP, AP50, and AP75 scores of 0.861, 0.942, and 0.887 respectively, outperforming traditional supervised learning approaches like Mask R-CNN and ViTPose-Base. Moreover, our model demonstrates superior computational efficiency in terms of parameter count and FLOPS. This research lays a solid foundation for future clinical applications of thermal imaging in mobility assessment and rehabilitation monitoring.
arxiv情報
著者 | Wei-Lun Chen,Chia-Yeh Hsieh,Yu-Hsiang Kao,Kai-Chun Liu,Sheng-Yu Peng,Yu Tsao |
発行日 | 2025-01-30 16:05:40+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google