Multi-layer Representation Learning for Robust OOD Image Classification

要約

畳み込みニューラルネットワークは、画像分類の標準になっています。
それにもかかわらず、データセット全体で高精度を維持することの難しさは、過去数年で明らかになりました。
このようなモデルを実際のシナリオやアプリケーションで利用するには、目に見えないデータに対して信頼できる予測を提供できなければなりません。
この論文では、CNNの中間層から特徴を抽出することが、モデルの最終的な予測に役立つ可能性があると主張します。
具体的には、HypercolumnsメソッドをResNet-18に適合させ、NICOデータセットで評価すると、モデルの精度が大幅に向上することを確認しました。

要約(オリジナル)

Convolutional Neural Networks have become the norm in image classification. Nevertheless, their difficulty to maintain high accuracy across datasets has become apparent in the past few years. In order to utilize such models in real-world scenarios and applications, they must be able to provide trustworthy predictions on unseen data. In this paper, we argue that extracting features from a CNN’s intermediate layers can assist in the model’s final prediction. Specifically, we adapt the Hypercolumns method to a ResNet-18 and find a significant increase in the model’s accuracy, when evaluating on the NICO dataset.

arxiv情報

著者 Aristotelis Ballas,Christos Diou
発行日 2022-07-27 17:46:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク