An Improved Encoder-Decoder Framework for Food Energy Estimation

要約

食事の評価は健康的なライフスタイルを維持するために不可欠です。
自動画像ベースの食事評価は、画像取得デバイス (携帯電話など) の普及の増加により、成長している研究分野です。
この研究では、単一の単眼画像から食物エネルギーを推定しますが、画像内に存在するエネルギー情報の量は限られているため抽出が困難であるため、これは困難な作業です。
そのために、エネルギー推定用に改良されたエンコーダ/デコーダ フレームワークを採用します。
エンコーダーは画像を、抽出しやすい形式で食品のエネルギー情報が埋め込まれた表現に変換し、デコーダーはそこからエネルギー情報を抽出します。
私たちの手法を実装するために、食事シーンの画像、食品のセグメンテーション マスク、グラウンド トゥルースのカロリー値を含む、管理栄養士によって検証された高品質の食品画像データセットをコンパイルします。
私たちの方法は、以前のカロリー推定方法よりも MAPE と MAE に関してそれぞれ 10\% と 30 kCal 以上改善されています。

要約(オリジナル)

Dietary assessment is essential to maintaining a healthy lifestyle. Automatic image-based dietary assessment is a growing field of research due to the increasing prevalence of image capturing devices (e.g. mobile phones). In this work, we estimate food energy from a single monocular image, a difficult task due to the limited hard-to-extract amount of energy information present in an image. To do so, we employ an improved encoder-decoder framework for energy estimation; the encoder transforms the image into a representation embedded with food energy information in an easier-to-extract format, which the decoder then extracts the energy information from. To implement our method, we compile a high-quality food image dataset verified by registered dietitians containing eating scene images, food-item segmentation masks, and ground truth calorie values. Our method improves upon previous caloric estimation methods by over 10\% and 30 kCal in terms of MAPE and MAE respectively.

arxiv情報

著者 Jack Ma,Jiangpeng He,Fengqing Zhu
発行日 2023-09-04 00:44:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク