要約
小分子は、生物医学、環境、および農薬のドメインで重要な役割を果たし、それぞれに異なる物理化学的要件と成功基準を備えています。
生物医学的研究は、広範なデータセットと確立されたベンチマークから利益を得ていますが、特に種固有の毒性に関しては、農薬データが依然として不足しています。
この研究は、生態学的に重要な花粉媒介者であるミツバチ(Apis mellifera)に対する実験的に検証された化学毒性の最も包括的なデータセットであるApistoxに焦点を当てています。
分子指紋、グラフカーネル、グラフニューラルネットワーク、および前提条件モデルなど、多様な機械学習アプローチを使用してApistoxを評価します。
Moleculenetベンチマークからの薬用データセットとの比較分析は、Apistoxが異なる化学空間を表していることを明らかにしています。
Apistoxなどの非医学的データセットのパフォーマンス劣化は、生物医学データのみで訓練されている現在の最先端のアルゴリズムの一般化が限られていることを示しています。
私たちの研究は、より多様なデータセットと農薬の領域に向けられたターゲットモデル開発の必要性を強調しています。
要約(オリジナル)
Small molecules play a critical role in the biomedical, environmental, and agrochemical domains, each with distinct physicochemical requirements and success criteria. Although biomedical research benefits from extensive datasets and established benchmarks, agrochemical data remain scarce, particularly with respect to species-specific toxicity. This work focuses on ApisTox, the most comprehensive dataset of experimentally validated chemical toxicity to the honey bee (Apis mellifera), an ecologically vital pollinator. We evaluate ApisTox using a diverse suite of machine learning approaches, including molecular fingerprints, graph kernels, and graph neural networks, as well as pretrained models. Comparative analysis with medicinal datasets from the MoleculeNet benchmark reveals that ApisTox represents a distinct chemical space. Performance degradation on non-medicinal datasets, such as ApisTox, demonstrates their limited generalizability of current state-of-the-art algorithms trained solely on biomedical data. Our study highlights the need for more diverse datasets and for targeted model development geared toward the agrochemical domain.
arxiv情報
著者 | Jakub Adamczyk,Jakub Poziemski,Pawel Siedlecki |
発行日 | 2025-04-01 07:57:14+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google