Feature Selection and Hyperparameter Fine-tuning in Artificial Neural Networks for Wood Quality Classification

要約

木材板の品質分類は製材業界では不可欠な作業ですが、発展途上国の中小企業では今でも人間のオペレーターがこの作業を行っているのが通常です。
問題の調査には機械学習アルゴリズムが採用されており、他のソリューションと比較してより手頃な価格の代替手段が提供されています。
ただし、このようなアプローチには通常、ハイパーパラメーターの適切な選択に関していくつかの欠点があります。
さらに、モデルは木の板の画像から抽出された特徴の影響を受けやすく、それがモデルの帰納に影響を与え、その結果としてその汎化力に影響を与えます。
したがって、この論文では、人工ニューラル ネットワーク (ANN) のハイパーパラメータを調整すると同時に、木板の品質をよりよく表す特性のサブセットを選択する問題を調査します。
実験は、製材業界から取得され、さまざまな特徴記述子を使用して記述された画像で構成されるプライベート データセットに対して行われました。
モデルの予測パフォーマンスは、ANN ハイパーパラメーター調整と特徴選択のいずれかを実行するランダム検索と同様に、5 つのベースライン手法と比較されました。
実験結果は、ハイパーパラメータを機能セットに従って調整するか、ハイパーパラメータ値を考慮して機能を選択する必要があることを示唆しています。
要約すると、最良の予測パフォーマンス、つまり $0.80$ のバランスの取れた精度は、(i) 特徴選択のみを実行するシナリオ、および (ii) 両方のタスクを同時に実行するシナリオの 2 つの異なるシナリオで達成されました。
したがって、産業上の応用の観点から、2 つのアプローチのうち少なくとも 1 つを考慮する必要があることを提案します。

要約(オリジナル)

Quality classification of wood boards is an essential task in the sawmill industry, which is still usually performed by human operators in small to median companies in developing countries. Machine learning algorithms have been successfully employed to investigate the problem, offering a more affordable alternative compared to other solutions. However, such approaches usually present some drawbacks regarding the proper selection of their hyperparameters. Moreover, the models are susceptible to the features extracted from wood board images, which influence the induction of the model and, consequently, its generalization power. Therefore, in this paper, we investigate the problem of simultaneously tuning the hyperparameters of an artificial neural network (ANN) as well as selecting a subset of characteristics that better describes the wood board quality. Experiments were conducted over a private dataset composed of images obtained from a sawmill industry and described using different feature descriptors. The predictive performance of the model was compared against five baseline methods as well as a random search, performing either ANN hyperparameter tuning and feature selection. Experimental results suggest that hyperparameters should be adjusted according to the feature set, or the features should be selected considering the hyperparameter values. In summary, the best predictive performance, i.e., a balanced accuracy of $0.80$, was achieved in two distinct scenarios: (i) performing only feature selection, and (ii) performing both tasks concomitantly. Thus, we suggest that at least one of the two approaches should be considered in the context of industrial applications.

arxiv情報

著者 Mateus Roder,Leandro Aparecido Passos,João Paulo Papa,André Luis Debiaso Rossi
発行日 2023-10-20 13:32:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク