The Role of Cross-Silo Federated Learning in Facilitating Data Sharing in the Agri-Food Sector

要約

タイトル – クロスシロ連合学習の役割は、農業・食品セクターでのデータ共有を促進することである
要約 – データ共有は、AI技術の採用において一般的に問題となっているが、特に農業・食品セクターにおいては重要な問題である。このセクターでは、データ保護が重要であり、所有者にとっては貴重な資産であり、適切に活用することで、競争優位性を得ることができる。しかし、AI技術を適用するためには、しばしば大量のトレーニングデータが必要であり、多くの場合、現実的ではない。しかし、最近の機械学習の進歩、例えば連合学習やプライバシー保護技術を用いることで、データを共有せずに、さまざまなソースからデータを収集し、モデルをトレーニングすることができる。本論文では、クロスシロ機械学習モデルを開発するために、分散化されたデータ(すなわち、交換や共有されないデータ)を利用する連合学習に基づく技術的な解決策を提案する。我々は、大豆収量予測を通じて生産最適化を改善するデータ共有提案に焦点を当て、そのような手法が他の問題設定においてどのように使用できるかについての潜在的なユースケースを提供する。我々の結果は、個々のデータソースでトレーニングされたモデルよりも優れた性能を発揮し、データ交換以外の手段による農業・食品セクターのデータ共有を実現し、生産性を向上させる新興の機械学習技術を採用するのに役立つことを示している。

要約(オリジナル)

Data sharing remains a major hindering factor when it comes to adopting emerging AI technologies in general, but particularly in the agri-food sector. Protectiveness of data is natural in this setting; data is a precious commodity for data owners, which if used properly can provide them with useful insights on operations and processes leading to a competitive advantage. Unfortunately, novel AI technologies often require large amounts of training data in order to perform well, something that in many scenarios is unrealistic. However, recent machine learning advances, e.g. federated learning and privacy-preserving technologies, can offer a solution to this issue via providing the infrastructure and underpinning technologies needed to use data from various sources to train models without ever sharing the raw data themselves. In this paper, we propose a technical solution based on federated learning that uses decentralized data, (i.e. data that are not exchanged or shared but remain with the owners) to develop a cross-silo machine learning model that facilitates data sharing across supply chains. We focus our data sharing proposition on improving production optimization through soybean yield prediction, and provide potential use-cases that such methods can assist in other problem settings. Our results demonstrate that our approach not only performs better than each of the models trained on an individual data source, but also that data sharing in the agri-food sector can be enabled via alternatives to data exchange, whilst also helping to adopt emerging machine learning technologies to boost productivity.

arxiv情報

著者 Aiden Durrant,Milan Markovic,David Matthews,David May,Jessica Enright,Georgios Leontidis
発行日 2023-05-04 14:41:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CR, cs.LG パーマリンク