Dataset Complexity Assessment Based on Cumulative Maximum Scaled Area Under Laplacian Spectrum

要約

データセットの複雑さの評価は、分類子をトレーニングする前に、複雑さの計算を使用してデータセットの分類パフォーマンスを予測することを目的としています。これは、分類子の選択とデータセットの削減にも使用できます。
深い畳み込みニューラル ネットワーク (DCNN) のトレーニング プロセスは、ハイパーパラメーターの不確実性と、さまざまなデータセットによって導入されるドメイン シフトのために、反復的で時間がかかります。
したがって、DCNN モデルをトレーニングする前に、データセットの複雑さを効果的に評価することで、分類のパフォーマンスを予測することは重要です。
この論文では、ラプラシアン スペクトル下の累積最大スケーリング面積 (cmsAULS) と呼ばれる新しい方法を提案します。これは、6 つのデータセットで最先端の複雑性評価パフォーマンスを達成できます。

要約(オリジナル)

Dataset complexity assessment aims to predict classification performance on a dataset with complexity calculation before training a classifier, which can also be used for classifier selection and dataset reduction. The training process of deep convolutional neural networks (DCNNs) is iterative and time-consuming because of hyperparameter uncertainty and the domain shift introduced by different datasets. Hence, it is meaningful to predict classification performance by assessing the complexity of datasets effectively before training DCNN models. This paper proposes a novel method called cumulative maximum scaled Area Under Laplacian Spectrum (cmsAULS), which can achieve state-of-the-art complexity assessment performance on six datasets.

arxiv情報

著者 Guang Li,Ren Togo,Takahiro Ogawa,Miki Haseyama
発行日 2022-09-29 13:02:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク