要約
質量スペクトルからの化合物の識別と構造注釈は、薬物検出、刑事法医学、小分子バイオマーカーの発見および化学工学に広く適用される確立されたタスクです。
スペクトルを提案します。未知の構造のスペクトル翻訳者、低解像度ガスクロマトグラフィー電子イオンイオン化質量スペクトル(GC-EI-MS)からの小分子の構造注釈のタスクに対処する深い神経モデル。
私たちのモデルは、\ textit {de novo}マナーでスペクトルを分析します – スペクトルから2D構造表現への直接的な変換。
私たちのアプローチは、スペクトルライブラリで利用できない化合物の分析に特に役立ちます。
さまざまなライブラリにわたる新規構造注釈タスクに関するモデルの厳密な評価では、標準のデータベース検索手法を広いマージンで上回りました。
NISTデータベースからの\ numprint {28267}スペクトルを含む延長されたテストセットでは、モデルの単一の提案がサブセットの化合物の43%を完全に再構築することを示します。
この単一の提案は、76%のケースでデータベースハイブリッド検索の候補(開業医の共通方法)よりも厳密に優れています。
〜10の提案のまだ手頃な価格のシナリオでは、65 \%で完全な再構成が達成され、84 \%はハイブリッド検索よりも優れています。
要約(オリジナル)
Compound identification and structure annotation from mass spectra is a well-established task widely applied in drug detection, criminal forensics, small molecule biomarker discovery and chemical engineering. We propose SpecTUS: Spectral Translator for Unknown Structures, a deep neural model that addresses the task of structural annotation of small molecules from low-resolution gas chromatography electron ionization mass spectra (GC-EI-MS). Our model analyzes the spectra in \textit{de novo} manner — a direct translation from the spectra into 2D-structural representation. Our approach is particularly useful for analyzing compounds unavailable in spectral libraries. In a rigorous evaluation of our model on the novel structure annotation task across different libraries, we outperformed standard database search techniques by a wide margin. On a held-out testing set, including \numprint{28267} spectra from the NIST database, we show that our model’s single suggestion perfectly reconstructs 43\% of the subset’s compounds. This single suggestion is strictly better than the candidate of the database hybrid search (common method among practitioners) in 76\% of cases. In a~still affordable scenario of~10 suggestions, perfect reconstruction is achieved in 65\%, and 84\% are better than the hybrid search.
arxiv情報
著者 | Adam Hájek,Helge Hecht,Elliott J. Price,Aleš Křenek |
発行日 | 2025-02-07 17:36:13+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google