要約
分子物性を正確に予測することは、革新的な治療法の開発や化学物質と生体システムとの複雑な相互作用を理解する上で非常に重要である。本研究では、個々の分子構造のグラフ表現とバイオメディカル知識グラフ(KG)のマルチドメイン情報を統合する新しいアプローチを提案します。両レベルの情報を統合することで、分子レベルおよびKGレベルの予測タスクに対して、より広範で頑健な表現を、新しい自己教師戦略によって事前に学習させることができる。性能評価として、11の困難な化学特性予測タスクに対して、事前学習したモデルの微調整を行いました。本フレームワークの結果は、微調整されたモデルが既存の最先端モデルを凌駕することを実証しています。
要約(オリジナル)
The precise prediction of molecular properties holds paramount importance in facilitating the development of innovative treatments and comprehending the intricate interplay between chemicals and biological systems. In this study, we propose a novel approach that integrates graph representations of individual molecular structures with multi-domain information from biomedical knowledge graphs (KGs). Integrating information from both levels, we can pre-train a more extensive and robust representation for both molecule-level and KG-level prediction tasks with our novel self-supervision strategy. For performance evaluation, we fine-tune our pre-trained model on 11 challenging chemical property prediction tasks. Results from our framework demonstrate our fine-tuned models outperform existing state-of-the-art models.
arxiv情報
著者 | Pengcheng Jiang |
発行日 | 2023-06-02 15:49:45+00:00 |
arxivサイト | arxiv_id(pdf) |