Digital Fingerprinting of Microstructures

要約

微細構造情報のフィンガープリンティングの効率的な手段を見つけることは、データ中心の機械学習アプローチを活用するための重要なステップです。
統計的フレームワークは、画像集団の圧縮された特徴付けのために体系的に開発されており、特殊なケースとしていくつかの古典的なコンピューター ビジョン手法が含まれています。
焦点は材料の微細構造にあります。
最終的な目的は、さまざまな高スループットの設計/製造/テスト シナリオのコンテキストでサンプル画像を迅速にフィンガープリントすることです。
これには、品質管理のための微細構造間の差異の定量化、微細構造の分類、画像データからの材料特性の予測、特定の特性を持つ新しい材料を設計するための潜在的な処理ルートの特定が含まれますが、これらに限定されません。
ここでは、微細構造の分類を検討し、その結果得られる特徴を、関連する一連の機械学習タスク、つまり教師あり学習、半教師あり学習、教師なし学習にわたって利用します。
このアプローチは、さまざまな側面を説明するために 2 つの異なるデータセットに適用され、その結果に基づいていくつかの推奨事項が作成されます。
特に、ImageNet データセットで事前トレーニングされた畳み込みニューラル ネットワーク (CNN) を使用した転移学習を活用する方法は、一般に他の方法よりも優れたパフォーマンスを発揮することが示されています。
さらに、これらの CNN ベースのフィンガープリントの次元削減は、検討されている教師あり学習アプローチの分類精度にほとんど影響を与えないことが示されています。
少数の画像のみがラベル付けされた大規模なデータセットがある状況では、ラベルなしデータへのグラフベースのラベル伝播は、ラベルなしデータを破棄して教師あり学習を実行するよりも有利であることが示されています。
特に、ポアソン学習によるラベル伝播は、低いラベル レートで非常に効果的であることが示されています。

要約(オリジナル)

Finding efficient means of fingerprinting microstructural information is a critical step towards harnessing data-centric machine learning approaches. A statistical framework is systematically developed for compressed characterisation of a population of images, which includes some classical computer vision methods as special cases. The focus is on materials microstructure. The ultimate purpose is to rapidly fingerprint sample images in the context of various high-throughput design/make/test scenarios. This includes, but is not limited to, quantification of the disparity between microstructures for quality control, classifying microstructures, predicting materials properties from image data and identifying potential processing routes to engineer new materials with specific properties. Here, we consider microstructure classification and utilise the resulting features over a range of related machine learning tasks, namely supervised, semi-supervised, and unsupervised learning. The approach is applied to two distinct datasets to illustrate various aspects and some recommendations are made based on the findings. In particular, methods that leverage transfer learning with convolutional neural networks (CNNs), pretrained on the ImageNet dataset, are generally shown to outperform other methods. Additionally, dimensionality reduction of these CNN-based fingerprints is shown to have negligible impact on classification accuracy for the supervised learning approaches considered. In situations where there is a large dataset with only a handful of images labelled, graph-based label propagation to unlabelled data is shown to be favourable over discarding unlabelled data and performing supervised learning. In particular, label propagation by Poisson learning is shown to be highly effective at low label rates.

arxiv情報

著者 Michael D. White,Alexander Tarakanov,Christopher P. Race,Philip J. Withers,Kody J. H. Law
発行日 2024-01-22 12:47:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cond-mat.mtrl-sci, cs.CV, physics.comp-ph パーマリンク