要約
最近の研究では、画像分類の分野で人間とディープ ニューラル ネットワーク (DNN) の間の行動の比較が数多く行われています。
多くの場合、比較研究では、オブジェクト カテゴリが形成された後の表現における類似性を測定および比較することにより、学習プロセスの最終結果に焦点を当てます。
しかし、これらの表現がどのように現れるかというプロセス、つまり、獲得中に観察される行動の変化や中間段階は、直接的かつ経験的に比較されることはあまりありません。
ここでは、人間の観察者とさまざまな古典的および最先端の DNN で転送可能な表現がどのように取得されるかについての詳細な調査を報告します。
私たちは、開始点、入力モダリティ、利用可能な入力データ、提供されるフィードバックなどの学習関連パラメーターを調整する、制約付き教師あり学習環境を開発します。
学習プロセス全体にわたって、学習した表現をこれまでに見たことのないテスト データにどの程度一般化できるかを評価し、比較します。
私たちの調査結果は、絶対的な分類パフォーマンスの点で、DNN が人間の学習者と同等、場合によってはそれを超えるレベルのデータ効率を実証し、この分野で一般的な前提に疑問を投げかけることを示しています。
しかし、学習プロセス全体にわたる比較では、表現上の大きな違いが明らかになります。DNN の学習は顕著な一般化の遅れによって特徴付けられますが、人間はトレーニング セット固有の情報を学習する予備段階を経ることなく、すぐに一般化可能な表現を獲得するようです。この情報は、後で新しい情報に転送されます。
データ。
要約(オリジナル)
Recent research has seen many behavioral comparisons between humans and deep neural networks (DNNs) in the domain of image classification. Often, comparison studies focus on the end-result of the learning process by measuring and comparing the similarities in the representations of object categories once they have been formed. However, the process of how these representations emerge — that is, the behavioral changes and intermediate stages observed during the acquisition — is less often directly and empirically compared. Here we report a detailed investigation of how transferable representations are acquired in human observers and various classic and state-of-the-art DNNs. We develop a constrained supervised learning environment in which we align learning-relevant parameters such as starting point, input modality, available input data and the feedback provided. Across the whole learning process we evaluate and compare how well learned representations can be generalized to previously unseen test data. Our findings indicate that in terms of absolute classification performance DNNs demonstrate a level of data efficiency comparable to — and sometimes even exceeding that — of human learners, challenging some prevailing assumptions in the field. However, comparisons across the entire learning process reveal significant representational differences: while DNNs’ learning is characterized by a pronounced generalisation lag, humans appear to immediately acquire generalizable representations without a preliminary phase of learning training set-specific information that is only later transferred to novel data.
arxiv情報
著者 | Lukas S. Huber,Fred W. Mast,Felix A. Wichmann |
発行日 | 2024-02-19 11:29:01+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google