A Little Bit Attention Is All You Need for Person Re-Identification

要約

人物の再識別は、モバイル ロボットが長期間にわたってユーザーを追跡する必要があるアプリケーションで重要な役割を果たします。ユーザーがしばらくの間部分的に監視されていない場合でも、ユーザーを追跡したり、オンデマンドで利用したりできるようにするためです。
このコンテキストでは、移動ロボットでの深層学習ベースのリアルタイム特徴抽出は、多くの場合、計算リソースが複数のタスクで共有される専用デバイスで実行されます。
したがって、推論速度を考慮する必要があります。
対照的に、個人の再識別は、アーキテクチャの変更によって改善されることが多く、その代償として推論が大幅に遅くなります。
アテンションブロックはその一例です。
最先端技術で使用されているいくつかの優れたアテンション ブロックは、モバイル ロボット アプリケーションでの使用を正当化するには高すぎる推論コストの影響を受けることを示します。
結果として、再識別精度の点ではるかに深いネットワークまたはより複雑な注意ブロックに追いつく一方で、推論速度にわずかに影響するだけの注意ブロックを提案します。
広範なニューラル アーキテクチャ検索を実行して、速度と精度の最適なトレードオフを達成するために、このアテンション ブロックをアーキテクチャに統合する必要がある場所のルールを導き出します。
最後に、再識別ベンチマークで最高のパフォーマンスを発揮する構成が、屋内ロボット データセットでもうまく機能することを確認します。

要約(オリジナル)

Person re-identification plays a key role in applications where a mobile robot needs to track its users over a long period of time, even if they are partially unobserved for some time, in order to follow them or be available on demand. In this context, deep-learning based real-time feature extraction on a mobile robot is often performed on special-purpose devices whose computational resources are shared for multiple tasks. Therefore, the inference speed has to be taken into account. In contrast, person re-identification is often improved by architectural changes that come at the cost of significantly slowing down inference. Attention blocks are one such example. We will show that some well-performing attention blocks used in the state of the art are subject to inference costs that are far too high to justify their use for mobile robotic applications. As a consequence, we propose an attention block that only slightly affects the inference speed while keeping up with much deeper networks or more complex attention blocks in terms of re-identification accuracy. We perform extensive neural architecture search to derive rules at which locations this attention block should be integrated into the architecture in order to achieve the best trade-off between speed and accuracy. Finally, we confirm that the best performing configuration on a re-identification benchmark also performs well on an indoor robotic dataset.

arxiv情報

著者 Markus Eisenbach,Jannik Lübberstedt,Dustin Aganian,Horst-Michael Gross
発行日 2023-02-28 13:54:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク