Dataset Structural Index: Leveraging a machine’s perspective towards visual data

要約

視覚と認識のアーキテクチャの進歩により、データを操作することは、アルゴリズムと同じかそれ以上に重要であることに気付きました。
今日まで、私たちは知識と世界観に基づいて機械を訓練してきました。
データセット構造インデックス (DSI) の全体的な概念は、データセットに対するマシンの視点を理解することを中心に展開しています。
DSI を使用して、視覚的なデータセットからより多くの情報を取得し、それを使用してデータを最適化し、より優れたアーキテクチャを作成し、どのモデルが最適かを推測できる 2 つのメタ値を示します。
これらの 2 つの値は、多様性寄与率と類似性マトリックスです。
この論文では、DSI の多くのアプリケーションを示しています。そのうちの 1 つは、より少ない量のデータでトレーニングされた同じモデル アーキテクチャで同じレベルの精度を達成する方法です。

要約(オリジナル)

With advances in vision and perception architectures, we have realized that working with data is equally crucial, if not more, than the algorithms. Till today, we have trained machines based on our knowledge and perspective of the world. The entire concept of Dataset Structural Index(DSI) revolves around understanding a machine`s perspective of the dataset. With DSI, I show two meta values with which we can get more information over a visual dataset and use it to optimize data, create better architectures, and have an ability to guess which model would work best. These two values are the Variety contribution ratio and Similarity matrix. In the paper, I show many applications of DSI, one of which is how the same level of accuracy can be achieved with the same model architectures trained over less amount of data.

arxiv情報

著者 Dishant Parikh
発行日 2023-01-23 05:33:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク