Application of Quantum Tensor Networks for Protein Classification

要約

我々は、タンパク質シーケンスが自然言語処理における文として考えることができ、既存の量子自然言語フレームワークを使用して解析して、合理的な量子ビットのパラメータ化された量子回路にすることができ、タンパク質関連のさまざまな機械学習問題を解決するように訓練できることを示します。
私たちは細胞内の位置に基づいてタンパク質を分類します。これは、生物学的プロセスと疾患メカニズムを理解するための鍵となるバイオインフォマティクスにおける極めて重要なタスクです。
量子強化処理機能を活用して、量子テンソル ネットワーク (QTN) がタンパク質配列の複雑さと多様性を効果的に処理できることを実証します。
包括的な実験結果によって裏付けられた、タンパク質データの微妙な要件に QTN アーキテクチャを適応させる詳細な方法論を紹介します。
前述のバイナリ分類タスクを解決するために、古典的なリカレント ニューラル ネットワーク (RNN) と畳み込みニューラル ネットワーク (CNN) からインスピレーションを得た 2 つの異なる QTN を実証します。
当社の最高パフォーマンスの量子モデルは 94% の精度率を達成しました。これは、ESM2 タンパク質言語モデルの埋め込みを使用する古典的なモデルのパフォーマンスに匹敵します。
ESM2 モデルは非常に大きく、最小構成で 800 万個のパラメーターが含まれているのに対し、私たちの最良の量子モデルでは約 800 個のパラメーターしか必要としないことは注目に値します。
我々は、これらのハイブリッド モデルが有望なパフォーマンスを示し、同様の複雑さの古典的なモデルと競合する可能性を示していることを実証します。

要約(オリジナル)

We show that protein sequences can be thought of as sentences in natural language processing and can be parsed using the existing Quantum Natural Language framework into parameterized quantum circuits of reasonable qubits, which can be trained to solve various protein-related machine-learning problems. We classify proteins based on their subcellular locations, a pivotal task in bioinformatics that is key to understanding biological processes and disease mechanisms. Leveraging the quantum-enhanced processing capabilities, we demonstrate that Quantum Tensor Networks (QTN) can effectively handle the complexity and diversity of protein sequences. We present a detailed methodology that adapts QTN architectures to the nuanced requirements of protein data, supported by comprehensive experimental results. We demonstrate two distinct QTNs, inspired by classical recurrent neural networks (RNN) and convolutional neural networks (CNN), to solve the binary classification task mentioned above. Our top-performing quantum model has achieved a 94% accuracy rate, which is comparable to the performance of a classical model that uses the ESM2 protein language model embeddings. It’s noteworthy that the ESM2 model is extremely large, containing 8 million parameters in its smallest configuration, whereas our best quantum model requires only around 800 parameters. We demonstrate that these hybrid models exhibit promising performance, showcasing their potential to compete with classical models of similar complexity.

arxiv情報

著者 Debarshi Kundu,Archisman Ghosh,Srinivasan Ekambaram,Jian Wang,Nikolay Dokholyan,Swaroop Ghosh
発行日 2024-03-11 16:47:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-bio.BM, quant-ph パーマリンク