要約
以前の研究に基づいて、タンパク質含量回帰と穀物の品種分類に焦点を当てて、2 つのデータセットのモデルを校正するための NIR-HSI 画像の使用を評価します。
タンパク質含有量に関する限られた参照データは、サブサンプリングしてバルクサンプルと関連付けることによって拡張されます。
ただし、この方法ではレプトクリティカル予測分布の偏りにより重大なバイアスが生じ、PLS-R モデルとディープ CNN モデルの両方に影響を与えます。
これらのバイアスを軽減し、平均タンパク質参照予測を改善するための調整を提案します。
さらに、両方のタスクに対する粒子と背景の比率の影響を調査します。
比率が高いほど正確な予測が得られますが、比率が低い画像をキャリブレーションに含めることで、そのようなシナリオに対するモデルの堅牢性が向上します。
要約(オリジナル)
Based on previous work, we assess the use of NIR-HSI images for calibrating models on two datasets, focusing on protein content regression and grain variety classification. Limited reference data for protein content is expanded by subsampling and associating it with the bulk sample. However, this method introduces significant biases due to skewed leptokurtic prediction distributions, affecting both PLS-R and deep CNN models. We propose adjustments to mitigate these biases, improving mean protein reference predictions. Additionally, we investigate the impact of grain-to-background ratios on both tasks. Higher ratios yield more accurate predictions, but including lower-ratio images in calibration enhances model robustness for such scenarios.
arxiv情報
著者 | Ole-Christian Galbo Engstrøm,Erik Schou Dreier,Birthe Møller Jespersen,Kim Steenstrup Pedersen |
発行日 | 2023-11-07 14:54:46+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google