ACP-ESM: A novel framework for classification of anticancer peptides using protein-oriented transformer approach

要約

抗がんペプチド(ACP)は、がん研究と治療の分野で大きな注目を集めている分子の一種だ。ACPはタンパク質の構成要素であるアミノ酸の短い鎖であり、がん細胞を選択的に標的にして死滅させる能力を持っている。ACPの主な利点のひとつは、がん細胞を選択的に標的化する一方で、健康な細胞は温存できることである。この選択性は、正常細胞と比較したがん細胞の表面特性の違いに起因することが多い。ACPががん治療の候補として研究されているのはそのためである。ACPは単独で、あるいは化学療法や放射線療法のような他の治療法と組み合わせて使用される。ACPはがん治療の新しいアプローチとして期待されているが、その安定性の最適化、選択性の向上、がん細胞へのデリバリーの強化、ペプチド配列の継続的な増加、信頼性が高く正確な予測モデルの開発など、克服すべき課題がある。本研究では、抗がんペプチドを同定するための効率的なトランスフォーマーベースのフレームワークを提案する。この目的のために、アミノ酸配列から抗がんペプチドを検出するために、ESM、ProtBert、BioBERT、SciBERTという4つの異なる変換モデルを採用した。提案フレームワークの貢献を実証するために、文献で広く使用されているデータセット、2つのバージョンのAntiCp2、cACP-DeepGram、ACP-740で広範な実験を行った。実験の結果、提案モデルを用いることで、分類精度が向上することが示された。提案フレームワークであるESMは、AntiCp2データセットで96.45%、cACP-DeepGramデータセットで97.66%、ACP-740データセットで88.51%の精度を示し、新たな最先端を決定した。

要約(オリジナル)

Anticancer peptides (ACPs) are a class of molecules that have gained significant attention in the field of cancer research and therapy. ACPs are short chains of amino acids, the building blocks of proteins, and they possess the ability to selectively target and kill cancer cells. One of the key advantages of ACPs is their ability to selectively target cancer cells while sparing healthy cells to a greater extent. This selectivity is often attributed to differences in the surface properties of cancer cells compared to normal cells. That is why ACPs are being investigated as potential candidates for cancer therapy. ACPs may be used alone or in combination with other treatment modalities like chemotherapy and radiation therapy. While ACPs hold promise as a novel approach to cancer treatment, there are challenges to overcome, including optimizing their stability, improving selectivity, and enhancing their delivery to cancer cells, continuous increasing in number of peptide sequences, developing a reliable and precise prediction model. In this work, we propose an efficient transformer-based framework to identify anticancer peptides for by performing accurate a reliable and precise prediction model. For this purpose, four different transformer models, namely ESM, ProtBert, BioBERT, and SciBERT are employed to detect anticancer peptides from amino acid sequences. To demonstrate the contribution of the proposed framework, extensive experiments are carried on widely-used datasets in the literature, two versions of AntiCp2, cACP-DeepGram, ACP-740. Experiment results show the usage of proposed model enhances classification accuracy when compared to the state-of-the-art studies. The proposed framework, ESM, exhibits 96.45 of accuracy for AntiCp2 dataset, 97.66 of accuracy for cACP-DeepGram dataset, and 88.51 of accuracy for ACP-740 dataset, thence determining new state-of-the-art.

arxiv情報

著者 Zeynep Hilal Kilimci,Mustafa Yalcin
発行日 2024-01-04 08:19:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CE, cs.LG, q-bio.BM パーマリンク