Mean of Means: A 10-dollar Solution for Human Localization with Calibration-free and Unconstrained Camera Settings

要約

正確な人間の位置特定は、特にメタバース時代において、さまざまなアプリケーションにとって重要です。
既存の高精度ソリューションは、タグに依存する高価なハードウェアに依存していますが、ビジョンベースの方法は、より安価でタグのない代替手段を提供します。
しかし、ステレオ ビジョンに基づく現在のビジョン ソリューションは、多段階 SVD ソルバーにおける厳格な透視変換原理と誤差伝播による制限に直面しています。
これらのソリューションには、セットアップに厳しい制約がある複数の高解像度カメラも必要です。
これらの制限に対処するために、人体の幾何学的中心を中心とした分布によって生成された観測値として人体のすべての点を考慮する確率的アプローチを提案します。
これにより、サンプリングが大幅に改善され、各対象地点のサンプル数が数百から数十億に増加します。
中心極限定理を利用して世界座標の分布の平均とピクセル座標の間の関係をモデル化することで、正規性を確保し、学習プロセスを促進します。
実験結果では、解像度 640×480 ピクセルの 2 台の Web カメラを使用して、わずか 10 米ドルの低コストで、0.3 メートルの範囲内で人間の位置特定精度が 95%、0.5 メートルの範囲内でほぼ 100% の精度を達成できることが実証されました。

要約(オリジナル)

Accurate human localization is crucial for various applications, especially in the Metaverse era. Existing high precision solutions rely on expensive, tag-dependent hardware, while vision-based methods offer a cheaper, tag-free alternative. However, current vision solutions based on stereo vision face limitations due to rigid perspective transformation principles and error propagation in multi-stage SVD solvers. These solutions also require multiple high-resolution cameras with strict setup constraints. To address these limitations, we propose a probabilistic approach that considers all points on the human body as observations generated by a distribution centered around the body’s geometric center. This enables us to improve sampling significantly, increasing the number of samples for each point of interest from hundreds to billions. By modeling the relation between the means of the distributions of world coordinates and pixel coordinates, leveraging the Central Limit Theorem, we ensure normality and facilitate the learning process. Experimental results demonstrate human localization accuracy of 95% within a 0.3m range and nearly 100% accuracy within a 0.5m range, achieved at a low cost of only 10 USD using two web cameras with a resolution of 640×480 pixels.

arxiv情報

著者 Tianyi Zhang,Wengyu Zhang,Xulu Zhang,Jiaxin Wu,Xiao-Yong Wei,Jiannong Cao,Qing Li
発行日 2024-07-30 14:45:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CG, cs.CV パーマリンク