要約
遺伝子や遺伝子産物の機能を探索することは、医学研究、進化生物学、環境科学など幅広い分野において極めて重要である。しかし、新たな機能を発見するためには、高価で膨大なウェットラボ実験が必要である。既存の自動機能アノテーション・予測手法は、主に配列、立体構造、タンパク質ファミリー情報を用いたタンパク質機能予測に焦点を当てている。本研究では、遺伝子機能間の基本的な関係を解読するために、Gene OntologyグラフとBERTによるアノテーション(GoBERT)を探索することにより、遺伝子機能予測問題に取り組むことを提案する。本研究で提案する新しい機能予測タスクは、既存の機能を入力として利用し、遺伝子と遺伝子産物への機能予測を一般化する。具体的には、2つの事前学習タスクが、機能の明示的および暗黙的な関係の両方を捕捉するために、GoBERTを共同で学習するように設計されている。近傍予測は、明示的な機能関係を捕捉する自己教師付きマルチラベル分類タスクである。指定されたマスキングと回復タスクは、GoBERTが関数間の暗黙的パターンを見つけるのに役立つ。事前に訓練された GoBERT は、既知の機能アノテーションに基づいて、様々な遺伝子および遺伝子産物の新規機能を予測する能力を有している。提案するGoBERTの優位性を実証するために、広範な実験、生物学的ケーススタディ、およびアブレーション研究が実施されている。
要約(オリジナル)
Exploring the functions of genes and gene products is crucial to a wide range of fields, including medical research, evolutionary biology, and environmental science. However, discovering new functions largely relies on expensive and exhaustive wet lab experiments. Existing methods of automatic function annotation or prediction mainly focus on protein function prediction with sequence, 3D-structures or protein family information. In this study, we propose to tackle the gene function prediction problem by exploring Gene Ontology graph and annotation with BERT (GoBERT) to decipher the underlying relationships among gene functions. Our proposed novel function prediction task utilizes existing functions as inputs and generalizes the function prediction to gene and gene products. Specifically, two pre-train tasks are designed to jointly train GoBERT to capture both explicit and implicit relations of functions. Neighborhood prediction is a self-supervised multi-label classification task that captures the explicit function relations. Specified masking and recovering task helps GoBERT in finding implicit patterns among functions. The pre-trained GoBERT possess the ability to predict novel functions for various gene and gene products based on known functional annotations. Extensive experiments, biological case studies, and ablation studies are conducted to demonstrate the superiority of our proposed GoBERT.
arxiv情報
著者 | Yuwei Miao,Yuzhi Guo,Hehuan Ma,Jingquan Yan,Feng Jiang,Rui Liao,Junzhou Huang |
発行日 | 2025-01-03 18:02:50+00:00 |
arxivサイト | arxiv_id(pdf) |