The Limits of Differential Privacy in Online Learning

要約

差動プライバシー(DP)は、プライバシーと有効性のトレードオフがプライベートデータ分析の中心的な問題の1つである機密データを実行する際に、アルゴリズムのプライバシー漏れを制限する正式な概念です。
この作業では、オンライン学習アルゴリズムの差別的なプライバシーの基本的な限界を調査し、DPなし、純粋なDP、および近似DPの3種類の制約を分離する証拠を提示します。
最初に、おおよそのDPの下でオンラインで学習できるが、適応性敵対的環境で純粋なDPで学習できないオンラインで学習できる仮説クラスについて説明します。
これは、適応性のある敵を扱う際に、近似DPを採用しなければならないことを示しています。
次に、プライベートオンライン学習者は、ほぼすべての仮説クラスに無限の数の間違いを犯さなければならないことを証明します。
これは本質的に以前の結果を一般的に一般化し、プライバシー要件がない場合に常に有限のミスと非プライベートの設定が常に達成可能であるため(クラスがオンラインで学習できる限り)、プライベートと非プライベートの設定を強く分離することを示しています。

要約(オリジナル)

Differential privacy (DP) is a formal notion that restricts the privacy leakage of an algorithm when running on sensitive data, in which privacy-utility trade-off is one of the central problems in private data analysis. In this work, we investigate the fundamental limits of differential privacy in online learning algorithms and present evidence that separates three types of constraints: no DP, pure DP, and approximate DP. We first describe a hypothesis class that is online learnable under approximate DP but not online learnable under pure DP under the adaptive adversarial setting. This indicates that approximate DP must be adopted when dealing with adaptive adversaries. We then prove that any private online learner must make an infinite number of mistakes for almost all hypothesis classes. This essentially generalizes previous results and shows a strong separation between private and non-private settings since a finite mistake bound is always attainable (as long as the class is online learnable) when there is no privacy requirement.

arxiv情報

著者 Bo Li,Wei Wang,Peng Ye
発行日 2025-03-17 15:43:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | The Limits of Differential Privacy in Online Learning はコメントを受け付けていません

GFSNetwork: Differentiable Feature Selection via Gumbel-Sigmoid Relaxation

要約

深い学習における機能の選択は、特に解釈可能性と計算効率が最重要である高次元の表形式データにとって、重要な課題のままです。
GFSNetworkは、温度制御されたGumbel-Sigmoidサンプリングを通じて微分可能な特徴選択を実行する新しいニューラルアーキテクチャです。
ユーザーが要求された機能の機能を定義する必要がある従来の方法とは異なり、GFSNetworkはエンドツーエンドのプロセス中に自動的に選択します。
さらに、GFSNetworkは、入力機能の数に関係なく、一定の計算オーバーヘッドを維持します。
GFSNetworkを一連の分類および回帰ベンチマークで評価します。このベンチマークでは、Deeplasso、注意マップ、従来の機能セレクターなどの最近の方法を常に上回り、機能を大幅に使用します。
さらに、現実世界のメタゲノムデータセットに関するアプローチを検証し、高次元の生物学的データにおけるその有効性を実証します。
結論として、私たちの方法は、ニューラルネットワークの柔軟性と従来の機能選択解釈可能性のギャップを埋めるスケーラブルなソリューションを提供します。
https://github.com/wwydmanski/gfsnetworkでgfsnetworkのPython実装と、Pypiパッケージ(gfs_network)を共有しています。

要約(オリジナル)

Feature selection in deep learning remains a critical challenge, particularly for high-dimensional tabular data where interpretability and computational efficiency are paramount. We present GFSNetwork, a novel neural architecture that performs differentiable feature selection through temperature-controlled Gumbel-Sigmoid sampling. Unlike traditional methods, where the user has to define the requested number of features, GFSNetwork selects it automatically during an end-to-end process. Moreover, GFSNetwork maintains constant computational overhead regardless of the number of input features. We evaluate GFSNetwork on a series of classification and regression benchmarks, where it consistently outperforms recent methods including DeepLasso, attention maps, as well as traditional feature selectors, while using significantly fewer features. Furthermore, we validate our approach on real-world metagenomic datasets, demonstrating its effectiveness in high-dimensional biological data. Concluding, our method provides a scalable solution that bridges the gap between neural network flexibility and traditional feature selection interpretability. We share our python implementation of GFSNetwork at https://github.com/wwydmanski/GFSNetwork, as well as a PyPi package (gfs_network).

arxiv情報

著者 Witold Wydmański,Marek Śmieja
発行日 2025-03-17 15:47:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | GFSNetwork: Differentiable Feature Selection via Gumbel-Sigmoid Relaxation はコメントを受け付けていません

Do you understand epistemic uncertainty? Think again! Rigorous frequentist epistemic uncertainty estimation in regression

要約

モデルの不確実性を定量化することは、予測の信頼性を理解するために重要ですが、aleatoricと認識論の不確実性を区別することは依然として挑戦的です。
最近の作業を分類から回帰まで拡張して、認識およびaleatoricの不確実性の推定に対する新しい頻繁なアプローチを提供します。
モデルをトレーニングして、初期出力を追加の入力として戻すことにより、条件付き予測を生成します。
この方法により、モデルの以前の回答を条件付けたときに予測応答がどのように変化するかを観察することにより、モデルの不確実性の厳密な測定が可能になります。
頻繁な方法で回帰の認識論的不確実性を分析するための完全な理論的枠組みを提供し、元のアーキテクチャに最小限の変更を加えて、モデルの不確実性を測定するために実際にどのように活用できるかを説明します。

要約(オリジナル)

Quantifying model uncertainty is critical for understanding prediction reliability, yet distinguishing between aleatoric and epistemic uncertainty remains challenging. We extend recent work from classification to regression to provide a novel frequentist approach to epistemic and aleatoric uncertainty estimation. We train models to generate conditional predictions by feeding their initial output back as an additional input. This method allows for a rigorous measurement of model uncertainty by observing how prediction responses change when conditioned on the model’s previous answer. We provide a complete theoretical framework to analyze epistemic uncertainty in regression in a frequentist way, and explain how it can be exploited in practice to gauge a model’s uncertainty, with minimal changes to the original architecture.

arxiv情報

著者 Enrico Foglia,Benjamin Bobbia,Nikita Durasov,Michael Bauerheim,Pascal Fua,Stephane Moreau,Thierry Jardin
発行日 2025-03-17 15:54:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML | Do you understand epistemic uncertainty? Think again! Rigorous frequentist epistemic uncertainty estimation in regression はコメントを受け付けていません

SMPR: A structure-enhanced multimodal drug-disease prediction model for drug repositioning and cold start

要約

薬物疾患の関係を再配置することは、常に研究の熱い分野でした。
ただし、生物学的に検証された薬物移転の実際の症例は非常に限られたままであり、既存のモデルはまだ薬物の構造情報を完全に利用していません。
さらに、ほとんどの再配置モデルは、関係マトリックスを完了するためにのみ使用され、薬物のコールドスタートの問題に対処する場合、それらの実用性は貧弱です。
このペーパーでは、構造強化マルチモーダル関係予測モデル(SMRP)を提案します。
SMPRは、mol2vecメソッドを使用して薬物埋め込み表現を生成し、異種ネットワークグラフニューラルネットワークを介して疾患埋め込み表現を学習し、薬物の笑顔構造に基づいています。
最終的に、薬物障害関係マトリックスが構築されます。
さらに、ユーザーの使用の難しさを減らすために、SMPRは、薬物関連の疾患を簡単かつ迅速に予測するための再配置の結果に基づく構造的類似性に基づいたコールドスタートインターフェイスも提供します。
モデルの再配置能力とコールドスタート機能は、複数の視点から検証されます。
再配置のAUCとACUPRスコアはそれぞれ99%と61%に達しますが、コールドスタートのAUCは80%を達成します。
特に、コールドスタートリコールインジケーターは70%以上に達する可能性があります。つまり、SMPRは正のサンプルにより敏感です。
最後に、ケース分析を使用してモデルの実用的な値を検証し、視覚分析はモデルへの構造の改善を直接示します。
迅速な使用のために、モデルのローカル展開も提供し、実行可能なプログラムにパッケージ化します。

要約(オリジナル)

Repositioning drug-disease relationships has always been a hot field of research. However, actual cases of biologically validated drug relocation remain very limited, and existing models have not yet fully utilized the structural information of the drug. Furthermore, most repositioning models are only used to complete the relationship matrix, and their practicality is poor when dealing with drug cold start problems. This paper proposes a structure-enhanced multimodal relationship prediction model (SMRP). SMPR is based on the SMILE structure of the drug, using the Mol2VEC method to generate drug embedded representations, and learn disease embedded representations through heterogeneous network graph neural networks. Ultimately, a drug-disease relationship matrix is constructed. In addition, to reduce the difficulty of users’ use, SMPR also provides a cold start interface based on structural similarity based on reposition results to simply and quickly predict drug-related diseases. The repositioning ability and cold start capability of the model are verified from multiple perspectives. While the AUC and ACUPR scores of repositioning reach 99% and 61% respectively, the AUC of cold start achieve 80%. In particular, the cold start Recall indicator can reach more than 70%, which means that SMPR is more sensitive to positive samples. Finally, case analysis is used to verify the practical value of the model and visual analysis directly demonstrates the improvement of the structure to the model. For quick use, we also provide local deployment of the model and package it into an executable program.

arxiv情報

著者 Xin Dong,Rui Miao,Suyan Zhang,Shuaibing Jia,Leifeng Zhang,Yong Liang,Jianhua Zhang,Yi Zhun Zhu
発行日 2025-03-17 15:59:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | SMPR: A structure-enhanced multimodal drug-disease prediction model for drug repositioning and cold start はコメントを受け付けていません

PERC: a suite of software tools for the curation of cryoEM data with application to simulation, modelling and machine learning

要約

データ、ツール、モデルへのアクセスの容易さは、科学的研究を促進します。
構造生物学には、実験的およびシミュレートされたデータセットの多数のオープンリポジトリが現在あります。
これらに簡単にアクセスして利用できることは、研究者が研究努力を最適に使用できるようにするために重要です。
ここに示されているツールは、既存のパブリックCryOEMデータセットを照合したり、新しい合成CRYOEMデータセットを作成して、新しいデータ処理と解釈アルゴリズムの開発を支援するのに役立ちます。
近年、構造生物学は、実験データセットの処理と再構築の多数のステップとこれらのアプローチの使用を支援するための多数の機械学習ベースのアルゴリズムの開発を見てきました。
構造生物学のこのような技術を開発するには、キュレートするのが面倒で扱いにくい大規模なデータセットへのアクセスが必要です。
このホワイトペーパーでは、Pythonソフトウェアパッケージのスイートを紹介します。これは、Perc(Profet、Empiarreader、Caked)とまとめて呼ばれます。
これらは、データキュレーションが構造生物学の研究にかかる負担を減らすように設計されています。
Protein Structure Fetcher(Profet)パッケージを使用すると、ユーザーはProtein Data BankまたはAlphaFoldデータベースからシーケンスまたは構造を便利にダウンロードおよびクリーブできます。
EmpiarReaderは、機械学習互換構造で電子顕微鏡パブリックイメージアーカイブデータセットの怠zyなロードを許可します。
主要な電子顕微鏡データ(CAKED)パッケージのクラスアグリゲーターは、電子クリオミクロスコサイト固有のデータの増強と標識を含む電子顕微鏡データに関する機械学習モデルのトレーニングをシームレスに促進するように設計されています。
これらのパッケージは、独立して、またはワークフローのビルディングブロックとして利用できます。
すべてはオープンソースリポジトリで利用でき、必要に応じてより高度なワークフローを容易にするために簡単に拡張できるように設計されています。

要約(オリジナル)

Ease of access to data, tools and models expedites scientific research. In structural biology there are now numerous open repositories of experimental and simulated datasets. Being able to easily access and utilise these is crucial for allowing researchers to make optimal use of their research effort. The tools presented here are useful for collating existing public cryoEM datasets and/or creating new synthetic cryoEM datasets to aid the development of novel data processing and interpretation algorithms. In recent years, structural biology has seen the development of a multitude of machine-learning based algorithms for aiding numerous steps in the processing and reconstruction of experimental datasets and the use of these approaches has become widespread. Developing such techniques in structural biology requires access to large datasets which can be cumbersome to curate and unwieldy to make use of. In this paper we present a suite of Python software packages which we collectively refer to as PERC (profet, EMPIARreader and CAKED). These are designed to reduce the burden which data curation places upon structural biology research. The protein structure fetcher (profet) package allows users to conveniently download and cleave sequences or structures from the Protein Data Bank or Alphafold databases. EMPIARreader allows lazy loading of Electron Microscopy Public Image Archive datasets in a machine-learning compatible structure. The Class Aggregator for Key Electron-microscopy Data (CAKED) package is designed to seamlessly facilitate the training of machine learning models on electron microscopy data, including electron-cryo-microscopy-specific data augmentation and labelling. These packages may be utilised independently or as building blocks in workflows. All are available in open source repositories and designed to be easily extensible to facilitate more advanced workflows if required.

arxiv情報

著者 Beatriz Costa-Gomes,Joel Greer,Nikolai Juraschko,James Parkhurst,Jola Mirecka,Marjan Famili,Camila Rangel-Smith,Oliver Strickson,Alan Lowe,Mark Basham,Tom Burnley
発行日 2025-03-17 16:07:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CE, cs.LG, q-bio.BM | PERC: a suite of software tools for the curation of cryoEM data with application to simulation, modelling and machine learning はコメントを受け付けていません

Strain Problems got you in a Twist? Try StrainRelief: A Quantum-Accurate Tool for Ligand Strain Calculations

要約

リガンドひずみエネルギーは、リガンドの結合と非バウンド立体構造のエネルギーの違いであり、構造ベースの小分子薬物設計の重要な成分です。
タンパク質 – 小分子の共結晶構造で観察されたリガンドの大部分は、低ひもの立体構造に結合し、構造ベースの薬物設計のための有用なフィルターに緊張エネルギーを作ります。
この作業では、リガンドひずみを高精度で計算するためのツールを提示します。
StrainReliefは、MACEニューラルネットワークポテンシャル(NNP)を使用し、密度汎関数理論(DFT)計算の大規模なデータベースで訓練され、量子精度で中性分子のリガンド株を推定します。
このツールは、代替NNPよりも正確には、DFTに対するひずみエネルギー差を1.4 kcal/mol以内に推定することを示します。
これらの結果は、創薬におけるNNPの有用性を強調し、創薬チームに便利なツールを提供します。

要約(オリジナル)

Ligand strain energy, the energy difference between the bound and unbound conformations of a ligand, is an important component of structure-based small molecule drug design. A large majority of observed ligands in protein-small molecule co-crystal structures bind in low-strain conformations, making strain energy a useful filter for structure-based drug design. In this work we present a tool for calculating ligand strain with a high accuracy. StrainRelief uses a MACE Neural Network Potential (NNP), trained on a large database of Density Functional Theory (DFT) calculations to estimate ligand strain of neutral molecules with quantum accuracy. We show that this tool estimates strain energy differences relative to DFT to within 1.4 kcal/mol, more accurately than alternative NNPs. These results highlight the utility of NNPs in drug discovery, and provide a useful tool for drug discovery teams.

arxiv情報

著者 Ewan R. S. Wallace,Nathan C. Frey,Joshua A. Rackers
発行日 2025-03-17 16:33:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, physics.chem-ph | Strain Problems got you in a Twist? Try StrainRelief: A Quantum-Accurate Tool for Ligand Strain Calculations はコメントを受け付けていません

Agents Play Thousands of 3D Video Games

要約

言語誘導ポリシー生成を通じて何千もの3Dビデオゲームをプレイできる人工知能エージェントを開発するための新しいフレームワークであるPortalを提示します。
意思決定の問題を言語モデリングタスクに変換することにより、私たちのアプローチは大きな言語モデル(LLM)を活用して、ドメイン固有の言語(DSL)で表される動作ツリーを生成します。
この方法は、戦略的な深さと迅速な適応性を維持しながら、従来の強化学習アプローチに関連する計算負担を排除します。
私たちのフレームワークでは、ルールベースのノードとニューラルネットワークコンポーネントを組み合わせたハイブリッドポリシー構造を導入し、高レベルの戦略的推論と正確な低レベル制御の両方を可能にします。
定量的ゲームメトリックとビジョン言語モデル分析を組み込んだデュアルフィードバックメカニズムは、戦術レベルと戦略的レベルの両方で反復的なポリシーの改善を促進します。
結果として生じるポリシーは、即座に展開可能で、人間が解釈でき、多様なゲーム環境全体に一般化することができます。
実験結果は、数千の一人称シューティングゲーム(FPS)ゲームにわたるポータルの有効性を示しており、従来のアプローチと比較した開発効率、政策一般化、行動の多様性の大幅な改善を示しています。
ポータルは、ゲームAI開発の大幅な進歩を表しており、最小限の開発オーバーヘッドで数千の商業ビデオゲームで動作できる洗練されたエージェントを作成するための実用的なソリューションを提供します。
3Dビデオゲームの実験結果は、https://zhongwen.one/projects/portalで最もよく見ることができます。

要約(オリジナル)

We present PORTAL, a novel framework for developing artificial intelligence agents capable of playing thousands of 3D video games through language-guided policy generation. By transforming decision-making problems into language modeling tasks, our approach leverages large language models (LLMs) to generate behavior trees represented in domain-specific language (DSL). This method eliminates the computational burden associated with traditional reinforcement learning approaches while preserving strategic depth and rapid adaptability. Our framework introduces a hybrid policy structure that combines rule-based nodes with neural network components, enabling both high-level strategic reasoning and precise low-level control. A dual-feedback mechanism incorporating quantitative game metrics and vision-language model analysis facilitates iterative policy improvement at both tactical and strategic levels. The resulting policies are instantaneously deployable, human-interpretable, and capable of generalizing across diverse gaming environments. Experimental results demonstrate PORTAL’s effectiveness across thousands of first-person shooter (FPS) games, showcasing significant improvements in development efficiency, policy generalization, and behavior diversity compared to traditional approaches. PORTAL represents a significant advancement in game AI development, offering a practical solution for creating sophisticated agents that can operate across thousands of commercial video games with minimal development overhead. Experiment results on the 3D video games are best viewed on https://zhongwen.one/projects/portal .

arxiv情報

著者 Zhongwen Xu,Xianliang Wang,Siyi Li,Tao Yu,Liang Wang,Qiang Fu,Wei Yang
発行日 2025-03-17 16:42:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Agents Play Thousands of 3D Video Games はコメントを受け付けていません

Follow-the-Regularized-Leader with Adversarial Constraints

要約

制約されたオンライン凸最適化(COCO)は、標準のオンライン凸最適化(OCO)フレームワークの一般化と見なすことができます。
各ラウンドで、学習者がアクションを選択した後にコスト関数と制約機能が明らかになります。
目標は、適応敵に対する後悔と累積制約違反(CCV)の両方を最小限に抑えることです。
後悔とCCVの両方で最適な$ o(\ sqrt {t})$ boundを得ることができることを初めて示します。

要約(オリジナル)

Constrained Online Convex Optimization (COCO) can be seen as a generalization of the standard Online Convex Optimization (OCO) framework. At each round, a cost function and constraint function are revealed after a learner chooses an action. The goal is to minimize both the regret and cumulative constraint violation (CCV) against an adaptive adversary. We show for the first time that is possible to obtain the optimal $O(\sqrt{T})$ bound on both regret and CCV, improving the best known bounds of $O \left( \sqrt{T} \right)$ and $\~{O} \left( \sqrt{T} \right)$ for the regret and CCV, respectively.

arxiv情報

著者 Ricardo N. Ferreira,Cláudia Soares
発行日 2025-03-17 16:51:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DS, cs.LG, math.OC, stat.ML | Follow-the-Regularized-Leader with Adversarial Constraints はコメントを受け付けていません

SyncDiff: Diffusion-based Talking Head Synthesis with Bottlenecked Temporal Visual Prior for Improved Synchronization

要約

スピーチツーリップ合成とも呼ばれるトーキングヘッド合成は、指定されたオーディオトラックと整合する顔の動きを再構築します。
合成されたビデオは、主に2つの側面、リップスピーチの同期と画像の忠実度で評価されます。
最近の研究は、GANベースおよび拡散ベースのモデルがこのタスクで最先端の(SOTA)パフォーマンスを達成し、拡散ベースのモデルが優れた画像の忠実度を達成するが、GANベースのカウンターパートと比較して低い同期を実現することを示しています。
この目的のために、拡散プロセスへの条件付けとして、Avhubertから抽出された情報ボトルネックと顔面に基づいたオーディオ機能を備えた時間的ポーズフレームを使用して、拡散ベースのモデルを改善するためのシンプルで効果的なアプローチであるSyncdiffを提案します。
他のSOTAモデルと直接比較するために、2つの正規のトーキングヘッドデータセット、LRS2およびLRS3のSyncdiffを評価します。
LRS2/LRS3データセットの実験は、Syncdiffが同期スコアを達成し、以前の拡散ベースの方法よりも比較的高い同期スコア27.7%/62.3%を達成することを示しています。

要約(オリジナル)

Talking head synthesis, also known as speech-to-lip synthesis, reconstructs the facial motions that align with the given audio tracks. The synthesized videos are evaluated on mainly two aspects, lip-speech synchronization and image fidelity. Recent studies demonstrate that GAN-based and diffusion-based models achieve state-of-the-art (SOTA) performance on this task, with diffusion-based models achieving superior image fidelity but experiencing lower synchronization compared to their GAN-based counterparts. To this end, we propose SyncDiff, a simple yet effective approach to improve diffusion-based models using a temporal pose frame with information bottleneck and facial-informative audio features extracted from AVHuBERT, as conditioning input into the diffusion process. We evaluate SyncDiff on two canonical talking head datasets, LRS2 and LRS3 for direct comparison with other SOTA models. Experiments on LRS2/LRS3 datasets show that SyncDiff achieves a synchronization score 27.7%/62.3% relatively higher than previous diffusion-based methods, while preserving their high-fidelity characteristics.

arxiv情報

著者 Xulin Fan,Heting Gao,Ziyi Chen,Peng Chang,Mei Han,Mark Hasegawa-Johnson
発行日 2025-03-17 16:58:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | SyncDiff: Diffusion-based Talking Head Synthesis with Bottlenecked Temporal Visual Prior for Improved Synchronization はコメントを受け付けていません

Investigating the effect of CPT in lateral spreading prediction using Explainable AI

要約

この研究では、AIモデルにCPTデータを組み込む可能性を評価するために、コーン浸透テストプロファイルから潜在的な特徴を抽出する自動エンコーダーアプローチを提案しています。
自動エンコーダーを使用して、重要な情報を保持しながら、土壌挙動タイプ指数(IC)および正規化されたコーン抵抗(QC1NC)の200 CPTプロファイルを圧縮します。
次に、抽出された潜在的な特徴をサイトパラメーターで利用して、2011年のクライストチャーチ地震での横方向の拡散発生を予測するためにXgboostモデルをトレーニングします。
潜在的なCPTを使用したモデルは、従来のCPTメトリックまたはCPTデータなしのアウトパフォームモデルを機能させ、83%以上の精度を達成しています。
説明可能なAIは、1〜3メートルの深さの土壌挙動に対応する最も重要な潜在的な特徴を明らかにし、液化評価のためのこの深さ範囲の重要性を強調しました。
Autoencoderアプローチは、CPTプロファイルを機械学習液化モデルの有益な潜在的な機能に凝縮するための自動化された手法を提供します。

要約(オリジナル)

This study proposes an autoencoder approach to extract latent features from cone penetration test profiles to evaluate the potential of incorporating CPT data in an AI model. We employ autoencoders to compress 200 CPT profiles of soil behavior type index (Ic) and normalized cone resistance (qc1Ncs) into ten latent features while preserving critical information. We then utilize the extracted latent features with site parameters to train XGBoost models for predicting lateral spreading occurrences in the 2011 Christchurch earthquake. Models using the latent CPT features outperformed models with conventional CPT metrics or no CPT data, achieving over 83% accuracy. Explainable AI revealed the most crucial latent feature corresponding to soil behavior between 1-3 meter depths, highlighting this depth range’s criticality for liquefaction evaluation. The autoencoder approach provides an automated technique for condensing CPT profiles into informative latent features for machine-learning liquefaction models.

arxiv情報

著者 Cheng-Hsi Hsiao,Ellen Rathje,Krishna Kumar
発行日 2025-03-17 17:22:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, physics.geo-ph | Investigating the effect of CPT in lateral spreading prediction using Explainable AI はコメントを受け付けていません