How stable are Transferability Metrics evaluations?


転送可能性メトリックは、関心が高まっている成熟分野であり、すべてを微調整することなく、特定のターゲット データセットに転送するのに最適なソース モデルを選択するためのヒューリスティックを提供することを目的としています。
その結果、セマンティック セグメンテーション シナリオで転送元の適切なソース データセットを選択する際の LogME の優位性、画像分類シナリオで適切なソース アーキテクチャを選択する際の NLEEP、および特定のソース モデルからどのターゲット タスクが最も恩恵を受けるかを決定する GBC の優位性が明らかになりました。


Transferability metrics is a maturing field with increasing interest, which aims at providing heuristics for selecting the most suitable source models to transfer to a given target dataset, without fine-tuning them all. However, existing works rely on custom experimental setups which differ across papers, leading to inconsistent conclusions about which transferability metrics work best. In this paper we conduct a large-scale study by systematically constructing a broad range of 715k experimental setup variations. We discover that even small variations to an experimental setup lead to different conclusions about the superiority of a transferability metric over another. Then we propose better evaluations by aggregating across many experiments, enabling to reach more stable conclusions. As a result, we reveal the superiority of LogME at selecting good source datasets to transfer from in a semantic segmentation scenario, NLEEP at selecting good source architectures in an image classification scenario, and GBC at determining which target task benefits most from a given source model. Yet, no single transferability metric works best in all scenarios.


著者 Andrea Agostinelli,Michal Pándy,Jasper Uijlings,Thomas Mensink,Vittorio Ferrari
発行日 2022-10-20 15:26:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV パーマリンク