要約
地下データセットは本質的に、膨大な量、多様な特徴、高いサンプリング速度などのビッグ データ特性を備えていますが、さまざまな物理的、工学的、地質学的入力からの次元の呪いによってさらに悪化します。
既存の次元削減 (DR) 手法の中でも、非線形次元削減 (NDR) 手法、特にメートル法多次元スケーリング (MDS) は、固有の複雑さのため、地表データセットに適しています。
MDS は固有のデータ構造を保持し、不確実性を定量化しますが、その制限には、ユークリッド変換に対して不変で不安定な一意の解と、アウトオブサンプル ポイント (OOSP) 拡張の欠如が含まれます。
地下推論および機械学習のワークフローを強化するには、データセットを OOSP に対応する安定した縮小次元表現に変換する必要があります。
私たちのソリューションは、LDS の安定化されたユークリッド不変表現のために剛体変換を採用しています。
MDS 入力相違度行列を計算し、複数の実現に剛体変換を適用することで、変換の不変性を確保し、OOSP を統合します。
このプロセスでは、凸包アルゴリズムを活用し、歪みの定量化のために損失関数と正規化された応力を組み込んでいます。
合成データ、さまざまな距離メトリクス、およびデュバーネー層からの現実世界の井戸を使用してアプローチを検証します。
結果は、一貫した LDS 表現を達成する上での私たちの方法の有効性を裏付けています。
さらに、私たちが提案する「応力比」(SR) メトリクスは、モデルの調整や推論分析に有益な不確実性に関する洞察を提供します。
その結果、当社のワークフローは、地下エネルギー資源エンジニアリングおよび関連するビッグデータ ワークフローの NDR における再現性と比較可能性の向上を約束します。
要約(オリジナル)
Subsurface datasets inherently possess big data characteristics such as vast volume, diverse features, and high sampling speeds, further compounded by the curse of dimensionality from various physical, engineering, and geological inputs. Among the existing dimensionality reduction (DR) methods, nonlinear dimensionality reduction (NDR) methods, especially Metric-multidimensional scaling (MDS), are preferred for subsurface datasets due to their inherent complexity. While MDS retains intrinsic data structure and quantifies uncertainty, its limitations include unstabilized unique solutions invariant to Euclidean transformations and an absence of out-of-sample points (OOSP) extension. To enhance subsurface inferential and machine learning workflows, datasets must be transformed into stable, reduced-dimension representations that accommodate OOSP. Our solution employs rigid transformations for a stabilized Euclidean invariant representation for LDS. By computing an MDS input dissimilarity matrix, and applying rigid transformations on multiple realizations, we ensure transformation invariance and integrate OOSP. This process leverages a convex hull algorithm and incorporates loss function and normalized stress for distortion quantification. We validate our approach with synthetic data, varying distance metrics, and real-world wells from the Duvernay Formation. Results confirm our method’s efficacy in achieving consistent LDS representations. Furthermore, our proposed ‘stress ratio’ (SR) metric provides insight into uncertainty, beneficial for model adjustments and inferential analysis. Consequently, our workflow promises enhanced repeatability and comparability in NDR for subsurface energy resource engineering and associated big data workflows.
arxiv情報
著者 | Ademide O. Mabadeje,Michael J. Pyrcz |
発行日 | 2024-03-12 17:46:10+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google