Accelerating Antibiotic Discovery with Large Language Models and Knowledge Graphs

要約

新規抗生物質の発見は、成長する抗菌耐性(AMR)に対処するために重要です。
ただし、製薬産業は、既知の化合物の再発見によって悪化した高コスト(10億ドルを超える)、長いタイムライン、および故障率の高さに直面しています。
アラームシステムとして機能するLLMベースのパイプラインを提案し、高価な再発見を防ぐために抗生物質活性の事前の証拠を検出します。
このシステムは、生物と化学文献を知識グラフ(kg)に統合し、分類学的解像度、同義語処理、およびマルチレベルの証拠分類を確保します。
73の潜在的な抗生物質生産生物のプライベートリストでパイプラインをテストし、評価のために12の負のヒットを開示しました。
結果は、パイプラインの有効性を強調しており、証拠を検討し、偽陰性の削減、意思決定を加速します。
ネガティブヒットのKGとインタラクティブな探索のユーザーインターフェイスは、公開されます。

要約(オリジナル)

The discovery of novel antibiotics is critical to address the growing antimicrobial resistance (AMR). However, pharmaceutical industries face high costs (over $1 billion), long timelines, and a high failure rate, worsened by the rediscovery of known compounds. We propose an LLM-based pipeline that acts as an alarm system, detecting prior evidence of antibiotic activity to prevent costly rediscoveries. The system integrates organism and chemical literature into a Knowledge Graph (KG), ensuring taxonomic resolution, synonym handling, and multi-level evidence classification. We tested the pipeline on a private list of 73 potential antibiotic-producing organisms, disclosing 12 negative hits for evaluation. The results highlight the effectiveness of the pipeline for evidence reviewing, reducing false negatives, and accelerating decision-making. The KG for negative hits and the user interface for interactive exploration will be made publicly available.

arxiv情報

著者 Maxime Delmas,Magdalena Wysocka,Danilo Gusicuma,André Freitas
発行日 2025-03-27 16:26:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク