Natural Language Processing Methods for the Study of Protein-Ligand Interactions

要約

自然言語処理 (NLP) の最近の進歩により、タンパク質-リガンド相互作用 (PLI) の創薬やタンパク質工学の取り組みとの関連性、および入手可能な生化学配列および構造データの量が増え続けることを考慮して、タンパク質-リガンド相互作用 (PLI) を予測するための効果的な方法の開発への関心が高まっています。
人間の言語と、タンパク質やリガンドを表すために使用される「言語」との類似点により、NLP 機械学習アプローチを使用して PLI 研究を前進させることが可能になりました。
このレビューでは、そのようなアプローチが最近の文献のどこでどのように適用されているかを説明し、長期短期記憶、変換器、注意などの有用なメカニズムについて議論します。
最後に、PLI の研究における NLP 手法の現在の限界と、将来の研究で取り組む必要がある重要な課題について説明します。

要約(オリジナル)

Recent advances in Natural Language Processing (NLP) have ignited interest in developing effective methods for predicting protein-ligand interactions (PLIs) given their relevance to drug discovery and protein engineering efforts and the ever-growing volume of biochemical sequence and structural data available. The parallels between human languages and the ‘languages’ used to represent proteins and ligands have enabled the use of NLP machine learning approaches to advance PLI studies. In this review, we explain where and how such approaches have been applied in the recent literature and discuss useful mechanisms such as long short-term memory, transformers, and attention. We conclude with a discussion of the current limitations of NLP methods for the study of PLIs as well as key challenges that need to be addressed in future work.

arxiv情報

著者 James Michels,Ramya Bandarupalli,Amin Ahangar Akbari,Thai Le,Hong Xiao,Jing Li,Erik F. Y. Hom
発行日 2024-10-17 16:56:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, q-bio.QM パーマリンク