Deep Learning methodology for the identification of wood species using high-resolution macroscopic images

要約

持続可能な木材取引を支援するには、世界中で木材種の識別の分野で大幅な進歩が必要です。
この研究では、木材の高解像度巨視画像による木材種の識別の自動化に貢献します。
この問題の主な課題は、木材の種類を正確に識別するには木材のきめの細かいパターンが重要であるが、これらのパターンは低/中解像度の画像で学習された従来の畳み込みニューラル ネットワーク (CNN) では適切に学習されないことです。
私たちは、パッチベースの推論投票方法論、略称 TDLI-PIV 方法論を使用した Timber Deep Learning Identification を提案します。
私たちの提案は、木材の識別において CNN が直面する固有の課題を克服するために、パッチングの概念と木材の高解像度巨視的画像の利用可能性を活用しています。
TDLI-PIV 手法は、木材の粒度の細かいパターンを捕捉することができ、さらに、協調的な投票推論プロセスを通じて堅牢性と予測精度を向上させます。
この研究では、GOIMAI-Phase-I と呼ばれる木材の巨視的画像の新しいデータセットも紹介します。これは、公的に利用可能な他のデータセットとは対照的に、きめ細かい詳細を捕捉するために光学倍率を使用して取得されました。
具体的には、GOIMAI-Phase-Iの画像は、スマートフォンに24倍の拡大レンズを取り付けたカメラで撮影されます。
私たちのデータセットには 2,120 枚の木材画像が含まれており、法的に保護されている 37 種の木材をカバーしています。
私たちの実験では、文献で入手可能な他の方法論との比較、データ拡張方法の探索、データセットのサイズが TDLI-PIV の精度に与える影響など、TDLI-PIV 方法論のパフォーマンスを評価しました。

要約(オリジナル)

Significant advancements in the field of wood species identification are needed worldwide to support sustainable timber trade. In this work we contribute to automate the identification of wood species via high-resolution macroscopic images of timber. The main challenge of this problem is that fine-grained patterns in timber are crucial in order to accurately identify wood species, and these patterns are not properly learned by traditional convolutional neural networks (CNNs) trained on low/medium resolution images. We propose a Timber Deep Learning Identification with Patch-based Inference Voting methodology, abbreviated TDLI-PIV methodology. Our proposal exploits the concept of patching and the availability of high-resolution macroscopic images of timber in order to overcome the inherent challenges that CNNs face in timber identification. The TDLI-PIV methodology is able to capture fine-grained patterns in timber and, moreover, boosts robustness and prediction accuracy via a collaborative voting inference process. In this work we also introduce a new data set of marcroscopic images of timber, called GOIMAI-Phase-I, which has been obtained using optical magnification in order to capture fine-grained details, which contrasts to the other datasets that are publicly available. More concretely, images in GOIMAI-Phase-I are taken with a smartphone with a 24x magnifying lens attached to the camera. Our data set contains 2120 images of timber and covers 37 legally protected wood species. Our experiments have assessed the performance of the TDLI-PIV methodology, involving the comparison with other methodologies available in the literature, exploration of data augmentation methods and the effect that the dataset size has on the accuracy of TDLI-PIV.

arxiv情報

著者 David Herrera-Poyatos,Andrés Herrera-Poyatos,Rosana Montes,Paloma de Palacios,Luis G. Esteban,Alberto García Iruela,Francisco García Fernández,Francisco Herrera
発行日 2024-06-17 17:31:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, I.2.1 パーマリンク