要約
機械学習は、地震解釈のワークフロー、特に障害の描写タスクにおいて重要な役割を果たしてきました。
ただし、最近の事前に守られたモデルと合成データセットの急増にもかかわらず、このフィールドには、さまざまな地質学的、取得、処理設定を表す地震データ全体のこれらのモデルの一般化可能性の制限に関する体系的な理解がまだありません。
異なるデータソース間の分布シフト、微調整戦略の制限とラベル付きデータアクセシビリティ、および一貫性のない評価プロトコルはすべて、実際の探査設定における信頼できる堅牢なモデルの展開における主要な障害を表しています。
この論文では、地震解釈におけるドメインシフト戦略の回答とガイドラインを提供するように明示的に設計された最初の大規模ベンチマーク研究を紹介します。
当社のベンチマークには、FaultSEG3D、亀裂、Thebeを含む3つの不均一データセット(合成および実際のデータ)でトレーニングおよび評価された200ドル以上のモデルが含まれます。
さまざまな程度のドメインシフトの下で、前脱、微調整、および共同トレーニング戦略を体系的に評価します。
私たちの分析は、現在の微調整慣行の脆弱性、壊滅的な忘却の出現、および体系的な方法でパフォーマンスを解釈する課題を強調しています。
現在の障害描写ワークフローに固有のトレードオフへの洞察を提供するための堅牢な実験ベースラインを確立し、地震解釈のためのより一般化可能で解釈可能な効果的な機械学習モデルを開発するための方向に光を当てます。
報告された洞察と分析は、地震解釈ワークフロー内の障害描写モデルの展開に関する一連のガイドラインを提供します。
要約(オリジナル)
Machine learning has taken a critical role in seismic interpretation workflows, especially in fault delineation tasks. However, despite the recent proliferation of pretrained models and synthetic datasets, the field still lacks a systematic understanding of the generalizability limits of these models across seismic data representing a variety of geologic, acquisition and processing settings. Distributional shifts between different data sources, limitations in fine-tuning strategies and labeled data accessibility, and inconsistent evaluation protocols all represent major roadblocks in the deployment of reliable and robust models in real-world exploration settings. In this paper, we present the first large-scale benchmarking study explicitly designed to provide answers and guidelines for domain shift strategies in seismic interpretation. Our benchmark encompasses over $200$ models trained and evaluated on three heterogeneous datasets (synthetic and real data) including FaultSeg3D, CRACKS, and Thebe. We systematically assess pretraining, fine-tuning, and joint training strategies under varying degrees of domain shift. Our analysis highlights the fragility of current fine-tuning practices, the emergence of catastrophic forgetting, and the challenges of interpreting performance in a systematic manner. We establish a robust experimental baseline to provide insights into the tradeoffs inherent to current fault delineation workflows, and shed light on directions for developing more generalizable, interpretable and effective machine learning models for seismic interpretation. The insights and analyses reported provide a set of guidelines on the deployment of fault delineation models within seismic interpretation workflows.
arxiv情報
著者 | Jorge Quesada,Chen Zhou,Prithwijit Chowdhury,Mohammad Alotaibi,Ahmad Mustafa,Yusufjon Kumamnov,Mohit Prabhushankar,Ghassan AlRegib |
発行日 | 2025-05-13 13:56:43+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google