To Perceive or Not to Perceive: Lightweight Stacked Hourglass Network

要約

人間の姿勢推定 (HPE) は、コンピューター ビジョンの古典的なタスクであり、関節の位置を識別することによって人の向きを表すことに重点を置いています。
モデルのパフォーマンスの損失を最小限に抑えて、積み重ねられた砂時計ネットワークのより軽いバージョンを設計します。
軽量の 2 スタックの砂時計には、深さ方向に分離可能な畳み込み、連結による残余接続、および砂時計のネック間の残余接続を備えたチャネルの数が減少しています。
最終的なモデルでは、パラメーター数が 79% 減少し、MAdd が同様に低下しており、パフォーマンスがわずかに低下しています。

要約(オリジナル)

Human pose estimation (HPE) is a classical task in computer vision that focuses on representing the orientation of a person by identifying the positions of their joints. We design a lighterversion of the stacked hourglass network with minimal loss in performance of the model. The lightweight 2-stacked hourglass has a reduced number of channels with depthwise separable convolutions, residual connections with concatenation, and residual connections between the necks of the hourglasses. The final model has a marginal drop in performance with 79% reduction in the number of parameters and a similar drop in MAdds

arxiv情報

著者 Jameel Hassan Abdul Samadh,Salwa K. Al Khatib
発行日 2023-02-09 18:04:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク