KeyPosS: Plug-and-Play Facial Landmark Detection through GPS-Inspired True-Range Multilateration

要約

顔分析の分野では、顔認識や表情分析からアニメーションに至るまで、さまざまなアプリケーションにとって正確なランドマーク検出が不可欠です。
ただし、従来のヒートマップまたは座標回帰ベースの手法は、計算負荷や量子化誤差の点で課題に直面することがよくあります。
これらの問題に対処するために、既存の方法とは一線を画す画期的な顔ランドマーク検出フレームワークである KeyPoint Positioning System (KeyPosS) を紹介します。
このフレームワークは、完全な畳み込みネットワークを利用して距離マップを予測し、関心のある地点 (POI) と複数のアンカー ポイントの間の距離を計算します。
これらのアンカー ポイントは、True-range Multilateration アルゴリズムを通じて POI の位置を三角測量するために巧妙に利用されています。
特に、KeyPosS のプラグ アンド プレイの性質により、あらゆるデコード段階へのシームレスな統合が可能になり、多用途で適応性のあるソリューションが保証されます。
私たちは、4 つの異なるデータセットで最先端のモデルに対してベンチマークを行うことにより、KeyPosS のパフォーマンスを徹底的に評価しました。
結果は、KeyPosS が、最小限の時間オーバーヘッドを必要としながら、低解像度設定で主要な方法よりも大幅に優れたパフォーマンスを発揮することを示しています。
コードは https://github.com/zhiqic/KeyPosS で入手できます。

要約(オリジナル)

In the realm of facial analysis, accurate landmark detection is crucial for various applications, ranging from face recognition and expression analysis to animation. Conventional heatmap or coordinate regression-based techniques, however, often face challenges in terms of computational burden and quantization errors. To address these issues, we present the KeyPoint Positioning System (KeyPosS) – a groundbreaking facial landmark detection framework that stands out from existing methods. The framework utilizes a fully convolutional network to predict a distance map, which computes the distance between a Point of Interest (POI) and multiple anchor points. These anchor points are ingeniously harnessed to triangulate the POI’s position through the True-range Multilateration algorithm. Notably, the plug-and-play nature of KeyPosS enables seamless integration into any decoding stage, ensuring a versatile and adaptable solution. We conducted a thorough evaluation of KeyPosS’s performance by benchmarking it against state-of-the-art models on four different datasets. The results show that KeyPosS substantially outperforms leading methods in low-resolution settings while requiring a minimal time overhead. The code is available at https://github.com/zhiqic/KeyPosS.

arxiv情報

著者 Xu Bao,Zhi-Qi Cheng,Jun-Yan He,Chenyang Li,Wangmeng Xiang,Jingdong Sun,Hanbing Liu,Wei Liu,Bin Luo,Yifeng Geng,Xuansong Xie
発行日 2023-08-18 16:54:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.MM パーマリンク