要約
ディープラーニングは、依然として特定の種類の科学データの扱いに苦労しています。
特に、事前トレーニングデータは、関連する分布シフト(たとえば、異なる測定機器の使用によって引き起こされるシフト)をカバーしていない可能性があります。
私たちは、ウラン鉱石精鉱 (UOC) の合成条件を分類するために訓練された深層学習モデルを検討し、モデル編集がこの領域で一般的な分布の変化に対する一般化を改善するのに特に効果的であることを示します。
特に、モデル編集は、湿度室で熟成させた U$_{3}$O$_{8}$ の顕微鏡写真と、それぞれ異なる走査型電子顕微鏡で取得した顕微鏡写真で構成される 2 つの精選されたデータセットに対する微調整よりも優れたパフォーマンスを発揮します。
要約(オリジナル)
Deep learning still struggles with certain kinds of scientific data. Notably, pretraining data may not provide coverage of relevant distribution shifts (e.g., shifts induced via the use of different measurement instruments). We consider deep learning models trained to classify the synthesis conditions of uranium ore concentrates (UOCs) and show that model editing is particularly effective for improving generalization to distribution shifts common in this domain. In particular, model editing outperforms finetuning on two curated datasets comprising of micrographs taken of U$_{3}$O$_{8}$ aged in humidity chambers and micrographs acquired with different scanning electron microscopes, respectively.
arxiv情報
著者 | Davis Brown,Cody Nizinski,Madelyn Shapiro,Corey Fallon,Tianzhixi Yin,Henry Kvinge,Jonathan H. Tu |
発行日 | 2024-07-22 16:06:51+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google