Blood Oxygen Saturation Estimation from Facial Video via DC and AC components of Spatio-temporal Map

要約

血液中の酸素レベルの指標である末梢血酸素飽和度 (SpO2) は、最も重要な生理学的パラメーターの 1 つです。
通常、SpO2 はパルスオキシメータで測定されますが、近年、顔や手の映像から非接触で SpO2 を推定する方法が注目されています。
この論文では、畳み込みニューラル ネットワーク (CNN) に基づく顔ビデオからの SpO2 推定方法を提案します。
本手法では、SpO2 推定の原理上重要な、顔映像の RGB 信号から抽出した直流 (DC) 成分と交流 (AC) 成分を考慮した CNN モデルを構築します。
具体的には、フィルタリング プロセスを使用して時空間マップから DC および AC コンポーネントを抽出し、これらのコンポーネントから SpO2 を予測するように CNN モデルをトレーニングします。
また、畳み込み層を介してDC成分とAC成分を抽出することにより、時空間マップからSpO2を直接予測するエンドツーエンドモデルも提案します。
50人の被験者からの顔ビデオとSpO2データを使用した実験は、提案された方法が現在の最先端のSpO2推定方法よりも優れた推定性能を達成することを示しています。

要約(オリジナル)

Peripheral blood oxygen saturation (SpO2), an indicator of oxygen levels in the blood, is one of the most important physiological parameters. Although SpO2 is usually measured using a pulse oximeter, non-contact SpO2 estimation methods from facial or hand videos have been attracting attention in recent years. In this paper, we propose an SpO2 estimation method from facial videos based on convolutional neural networks (CNN). Our method constructs CNN models that consider the direct current (DC) and alternating current (AC) components extracted from the RGB signals of facial videos, which are important in the principle of SpO2 estimation. Specifically, we extract the DC and AC components from the spatio-temporal map using filtering processes and train CNN models to predict SpO2 from these components. We also propose an end-to-end model that predicts SpO2 directly from the spatio-temporal map by extracting the DC and AC components via convolutional layers. Experiments using facial videos and SpO2 data from 50 subjects demonstrate that the proposed method achieves a better estimation performance than current state-of-the-art SpO2 estimation methods.

arxiv情報

著者 Yusuke Akamatsu,Yoshifumi Onishi,Hitoshi Imaoka
発行日 2022-12-14 09:11:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV, eess.SP パーマリンク