Texture Extraction Methods Based Ensembling Framework for Improved Classification

要約

テクスチャ ベースの分類ソリューションは、産業検査から健康関連のアプリケーションまで、多くの分野でその重要性が証明されています。
テクスチャ機能の学習と CNN ベースのアーキテクチャに基づいて新しい方法が開発され、豊富なテクスチャ ベースの機能を備えた画像のコンピューター ビジョンのユースケースに対応しています。
近年、テクスチャベースの分類問題を解決し、最先端の結果を実証するアーキテクチャが登場しました。
ただし、これらのアプローチの 1 つの制限は、すべてのタイプの画像テクスチャ パターンに適しているとは言えないことです。
各テクニックには、特定のテクスチャ タイプに対してのみ利点があります。
この欠点に対処するために、最も関連性の高いテクスチャ機能を抽出するために、複数のテクスチャベースの手法を CNN バックボーンと独自に組み合わせたフレームワークを提案します。
これにより、モデルを自己選択的にトレーニングし、現在公開されているベンチマークよりも優れた結果を生成できます (ほぼ同じ数のモデル パラメーターを使用)。
私たちが提案するフレームワークは、ほとんどのテクスチャ タイプで同時に適切に機能し、既存のアーキテクチャよりも優れた結果を達成するために、追加のテクスチャ ベースのメソッドに柔軟に対応できます。
この作業では、まず、ベンチマーク データセットで単独で、および他の TE メソッドと組み合わせて使用​​した場合の既存の手法の相対的な重要性に関する分析を提示します。
次に、空間情報を表すグローバル平均プーリングは、テクスチャベースの分類タスクのトレーニング中にネットワークに適用される TE メソッドと比較して重要性が低いことを示します。
最後に、提案したフレームワークを使用して 3 つの既存のテクスチャ ベースの手法を組み合わせることにより、いくつかのテクスチャ ベースのベンチマーク データセットの最先端の結果を提示します。

要約(オリジナル)

Texture-based classification solutions have proven their significance in many domains, from industrial inspections to health-related applications. New methods have been developed based on texture feature learning and CNN-based architectures to address computer vision use cases for images with rich texture-based features. In recent years, architectures solving texture-based classification problems and demonstrating state-of-the-art results have emerged. Yet, one limitation of these approaches is that they cannot claim to be suitable for all types of image texture patterns. Each technique has an advantage for a specific texture type only. To address this shortcoming, we propose a framework that combines more than one texture-based techniques together, uniquely, with a CNN backbone to extract the most relevant texture features. This enables the model to be trained in a self-selective manner and produce improved results over current published benchmarks — with almost same number of model parameters. Our proposed framework works well on most texture types simultaneously and allows flexibility for additional texture-based methods to be accommodated to achieve better results than existing architectures. In this work, firstly, we present an analysis on the relative importance of existing techniques when used alone and in combination with other TE methods on benchmark datasets. Secondly, we show that Global Average Pooling which represents the spatial information — is of less significance in comparison to the TE method(s) applied in the network while training for texture-based classification tasks. Finally, we present state-of-the-art results for several texture-based benchmark datasets by combining three existing texture-based techniques using our proposed framework.

arxiv情報

著者 Vijay Pandey,Trapti Kalra,Mayank Gubba,Mohammed Faisal
発行日 2022-08-30 10:39:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク