要約
データのクリーニング、アーキテクチャ、および損失関数の設計は、高性能の顔認識に貢献する重要な要素です。
以前は、研究コミュニティはそれぞれの単一の側面のパフォーマンスを改善しようとしましたが、3 つの側面すべての最適な設計の共同検索に関する統一されたソリューションを提示できませんでした。
この論文では、これらの側面が互いに密接に関連していることを初めて確認しました。
各側面の設計を最適化すると、実際にはパフォーマンスが大幅に制限され、アルゴリズム設計に偏りが生じます。
具体的には、最適なモデル アーキテクチャまたは損失関数がデータ クリーニングと密接に関連していることがわかります。
単一側面研究のバイアスを排除し、顔認識モデル設計の全体的な理解を提供するために、最初に各側面の検索空間を慎重に設計し、次に包括的な検索方法を導入して、最適なデータのクリーニング、アーキテクチャ、および損失を共同で検索します。
機能設計。
私たちのフレームワークでは、革新的な強化学習ベースのアプローチを使用して、提案された包括的な検索を可能な限り柔軟にします。
百万レベルの顔認識ベンチマークに関する広範な実験により、各側面と包括的な検索に対して新しく設計された検索スペースの有効性が実証されました。
私たちは、単一の研究トラックごとに開発された専門家のアルゴリズムを大幅に上回っています。
さらに重要なことは、検索された最適計画と単一因子の独立計画との違いを分析することです。
強力なモデルは、より困難なトレーニング データセットと損失関数で最適化される傾向があることを指摘します。
私たちの実証研究は、より堅牢な顔認識システムに向けた将来の研究の指針を提供できます。
要約(オリジナル)
Data cleaning, architecture, and loss function design are important factors contributing to high-performance face recognition. Previously, the research community tries to improve the performance of each single aspect but failed to present a unified solution on the joint search of the optimal designs for all three aspects. In this paper, we for the first time identify that these aspects are tightly coupled to each other. Optimizing the design of each aspect actually greatly limits the performance and biases the algorithmic design. Specifically, we find that the optimal model architecture or loss function is closely coupled with the data cleaning. To eliminate the bias of single-aspect research and provide an overall understanding of the face recognition model design, we first carefully design the search space for each aspect, then a comprehensive search method is introduced to jointly search optimal data cleaning, architecture, and loss function design. In our framework, we make the proposed comprehensive search as flexible as possible, by using an innovative reinforcement learning based approach. Extensive experiments on million-level face recognition benchmarks demonstrate the effectiveness of our newly-designed search space for each aspect and the comprehensive search. We outperform expert algorithms developed for each single research track by large margins. More importantly, we analyze the difference between our searched optimal design and the independent design of the single factors. We point out that strong models tend to optimize with more difficult training datasets and loss functions. Our empirical study can provide guidance in future research towards more robust face recognition systems.
arxiv情報
著者 | Manyuan Zhang,Guanglu Song,Yu Liu,Hongsheng Li |
発行日 | 2022-09-12 13:03:26+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google