Comparing Machine Learning Techniques for Alfalfa Biomass Yield Prediction

要約

アルファルファ作物は家畜の飼料として世界的に重要であるため、特に地球規模の気候変動や従来の方法の精度が低下する中、非常に効率的な植え付けと収穫は多くの産業に利益をもたらす可能性があります.
機械学習 (ML) を使用してアルファルファやその他の作物の収量を予測する最近の研究では、有望性が示されています。
以前の取り組みでは、リモート センシング、天候、植栽、および土壌データを使用して、収量予測用の機械学習モデルをトレーニングしていました。
ただし、リモート センシングはうまく機能しますが、モデルには大量のデータが必要であり、収穫シーズンが始まるまで予測を行うことはできません。
ケンタッキー州とジョージア州で行われたアルファルファの品種試験から得られた気象データと植栽データを使用して、以前の研究では機能選択手法を比較して、最適な手法と最適な機能セットを見つけました。
この作業では、ハイパーパラメーター最適化のクロス検証を使用してさまざまな機械学習モデルをトレーニングし、バイオマス収量を予測しました。より複雑な手法を使用した同様の作業よりも高い精度を示しました。
私たちの最良の個別モデルは、平均絶対誤差が 0.081 トン/エーカー、R{$^2$} が 0.941 のランダム フォレストでした。
次に、ウィスコンシン州とミシシッピ州を含むようにこのデータセットを拡張し、実験を繰り返して、回帰木で 0.982 というより高い最高の R{$^2$} を得ました。
次に、複数のソース状態でトレーニングし、1 つのターゲット状態でテストしたときに、この問題のドメイン適応 (DA) の適格性を調査するために、テスト データセットを状態ごとに分離しました。
このトリビアル DA (TDA) アプローチには、今後の作業でより複雑な DA 手法を調査することで、改善の余地がたくさんあります。

要約(オリジナル)

The alfalfa crop is globally important as livestock feed, so highly efficient planting and harvesting could benefit many industries, especially as the global climate changes and traditional methods become less accurate. Recent work using machine learning (ML) to predict yields for alfalfa and other crops has shown promise. Previous efforts used remote sensing, weather, planting, and soil data to train machine learning models for yield prediction. However, while remote sensing works well, the models require large amounts of data and cannot make predictions until the harvesting season begins. Using weather and planting data from alfalfa variety trials in Kentucky and Georgia, our previous work compared feature selection techniques to find the best technique and best feature set. In this work, we trained a variety of machine learning models, using cross validation for hyperparameter optimization, to predict biomass yields, and we showed better accuracy than similar work that employed more complex techniques. Our best individual model was a random forest with a mean absolute error of 0.081 tons/acre and R{$^2$} of 0.941. Next, we expanded this dataset to include Wisconsin and Mississippi, and we repeated our experiments, obtaining a higher best R{$^2$} of 0.982 with a regression tree. We then isolated our testing datasets by state to explore this problem’s eligibility for domain adaptation (DA), as we trained on multiple source states and tested on one target state. This Trivial DA (TDA) approach leaves plenty of room for improvement through exploring more complex DA techniques in forthcoming work.

arxiv情報

著者 Jonathan Vance,Khaled Rasheed,Ali Missaoui,Frederick Maier,Christian Adkins,Chris Whitmire
発行日 2022-10-20 13:00:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク