Does progress on ImageNet transfer to real-world datasets?

要約

ImageNet の進行状況は実際のデータセットに反映されますか?
6 つの実用的な画像分類データセットでさまざまな精度 (57% ~ 83%) の ImageNet 事前トレーニング済みモデルを評価することにより、この問題を調査します。
特に、モデルを比較するために収集された Web スクレイピング ベンチマークとは対照的に、実世界のタスク (カメラ トラップや衛星からの画像の分類など) を解決する目的で収集されたデータセットを研究します。
複数のデータセットでは、ImageNet の精度が高いモデルから一貫してパフォーマンスが向上するとは限りません。
特定のタスクでは、データ拡張などの介入によってパフォーマンスが向上しますが、アーキテクチャではパフォーマンスが向上しません。
将来のベンチマークには、学習アルゴリズムを改善するためのより包括的なアプローチを促進するために、より多様なデータセットが含まれることを願っています。

要約(オリジナル)

Does progress on ImageNet transfer to real-world datasets? We investigate this question by evaluating ImageNet pre-trained models with varying accuracy (57% – 83%) on six practical image classification datasets. In particular, we study datasets collected with the goal of solving real-world tasks (e.g., classifying images from camera traps or satellites), as opposed to web-scraped benchmarks collected for comparing models. On multiple datasets, models with higher ImageNet accuracy do not consistently yield performance improvements. For certain tasks, interventions such as data augmentation improve performance even when architectures do not. We hope that future benchmarks will include more diverse datasets to encourage a more comprehensive approach to improving learning algorithms.

arxiv情報

著者 Alex Fang,Simon Kornblith,Ludwig Schmidt
発行日 2023-01-11 18:55:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク