Recognizing People by Body Shape Using Deep Networks of Images and Words

要約

個人識別の一般的かつ重要な用途は、顔が見えないか、十分に解像されていない距離や視点で使用されます。
距離や視点の変化に応じて身体の形状を生体認証として検査します。
私たちは、標準的な物体分類ネットワークと物体の言語的 (単語ベースの) 記述に基づく表現を組み合わせたアプローチを提案します。
言語トレーニングの有無にかかわらず、広範囲の距離/視界 (近距離、100m、200m、270m、300m、370m、400m、490m、500m、600m) にわたって撮影された画像内の体型から人を識別する能力について、言語トレーニングを行ったアルゴリズムと行わないアルゴリズムを比較しました。
、無人航空機 [UAV] によって撮影された画像ではピッチが高くなります)。
オープンセット テストでの ID 一致ランキングと誤認エラーによって測定された精度は、驚くほど良好でした。
アイデンティティのランキングでは、近距離画像では言語モデルの方が正確でしたが、中間距離では非言語モデルの方が優れていました。
言語埋め込みと非言語埋め込みの融合により、パフォーマンスはまったく向上しましたが、距離は最も遠かったです。
非言語モデルではすべての距離で誤認が減少しましたが、言語モデルと非言語モデルを融合すると、UAV 画像を除くすべての誤認が減少しました。
我々は、身体形状の言語的および非言語的表現は、対象となるアプリケーションでの識別を向上させることができる、身体の補完的な識別情報を提供できると結論付けています。

要約(オリジナル)

Common and important applications of person identification occur at distances and viewpoints in which the face is not visible or is not sufficiently resolved to be useful. We examine body shape as a biometric across distance and viewpoint variation. We propose an approach that combines standard object classification networks with representations based on linguistic (word-based) descriptions of bodies. Algorithms with and without linguistic training were compared on their ability to identify people from body shape in images captured across a large range of distances/views (close-range, 100m, 200m, 270m, 300m, 370m, 400m, 490m, 500m, 600m, and at elevated pitch in images taken by an unmanned aerial vehicle [UAV]). Accuracy, as measured by identity-match ranking and false accept errors in an open-set test, was surprisingly good. For identity-ranking, linguistic models were more accurate for close-range images, whereas non-linguistic models fared better at intermediary distances. Fusion of the linguistic and non-linguistic embeddings improved performance at all, but the farthest distance. Although the non-linguistic model yielded fewer false accepts at all distances, fusion of the linguistic and non-linguistic models decreased false accepts for all, but the UAV images. We conclude that linguistic and non-linguistic representations of body shape can offer complementary identity information for bodies that can improve identification in applications of interest.

arxiv情報

著者 Blake A. Myers,Lucas Jaggernauth,Thomas M. Metz,Matthew Q. Hill,Veda Nandan Gandi,Carlos D. Castillo,Alice J. O’Toole
発行日 2023-05-30 16:03:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク