DANCE: Deep Learning-Assisted Analysis of Protein Sequences Using Chaos Enhanced Kaleidoscopic Images

要約

がんは、制御されない細胞増殖を特徴とする複雑な病気です。
免疫系における重要なタンパク質である T 細胞受容体 (TCR) は、がんに関連する抗原を含む抗原の認識において重要な役割を果たします。
配列決定技術の最近の進歩により、TCR レパートリーの包括的なプロファイリングが容易になり、強力な抗がん活性を持つ TCR が明らかになり、TCR ベースの免疫療法が可能になりました。
ただし、これらの複雑な生体分子を分析するには、その構造および機能情報を捕捉する効率的な表現が必要です。
T 細胞タンパク質配列は、他の生体分子と比較して比較的短いため、特有の課題を引き起こします。
画像ベースの表現アプローチは、効率的な埋め込みにとって好ましい選択肢となり、重要な詳細の保存を可能にし、T 細胞タンパク質配列の包括的な分析を可能にします。
この論文では、万華鏡画像アプローチを使用したカオス ゲーム表現 (CGR) のアイデアを使用して、タンパク質配列から画像を生成することを提案します。
カオス拡張万華鏡画像 (DANCE と呼ばれる) を使用したタンパク質配列のディープラーニング支援分析は、中心シード ポイントの周囲にカオス ゲーム ルールを再帰的に適用することにより、タンパク質配列を視覚化するユニークな方法を提供します。
T細胞受容体(TCR)はがん疾患に対する免疫応答で知られているため、我々はそれぞれの標的がん細胞の観点からT細胞受容体(TCR)タンパク質配列の分類を行っています。
TCR シーケンスは DANCE メソッドを使用して画像に変換されます。
私たちは、深層学習視覚モデルを使用して分類を実行し、生成された万華鏡のような画像で観察される視覚パターンと、基礎となるタンパク質の特性との関係についての洞察を取得します。
CGR ベースの画像生成と深層学習分類を組み合わせることで、この研究はタンパク質分析領域に新たな可能性を切り開きます。

要約(オリジナル)

Cancer is a complex disease characterized by uncontrolled cell growth. T cell receptors (TCRs), crucial proteins in the immune system, play a key role in recognizing antigens, including those associated with cancer. Recent advancements in sequencing technologies have facilitated comprehensive profiling of TCR repertoires, uncovering TCRs with potent anti-cancer activity and enabling TCR-based immunotherapies. However, analyzing these intricate biomolecules necessitates efficient representations that capture their structural and functional information. T-cell protein sequences pose unique challenges due to their relatively smaller lengths compared to other biomolecules. An image-based representation approach becomes a preferred choice for efficient embeddings, allowing for the preservation of essential details and enabling comprehensive analysis of T-cell protein sequences. In this paper, we propose to generate images from the protein sequences using the idea of Chaos Game Representation (CGR) using the Kaleidoscopic images approach. This Deep Learning Assisted Analysis of Protein Sequences Using Chaos Enhanced Kaleidoscopic Images (called DANCE) provides a unique way to visualize protein sequences by recursively applying chaos game rules around a central seed point. we perform the classification of the T cell receptors (TCRs) protein sequences in terms of their respective target cancer cells, as TCRs are known for their immune response against cancer disease. The TCR sequences are converted into images using the DANCE method. We employ deep-learning vision models to perform the classification to obtain insights into the relationship between the visual patterns observed in the generated kaleidoscopic images and the underlying protein properties. By combining CGR-based image generation with deep learning classification, this study opens novel possibilities in the protein analysis domain.

arxiv情報

著者 Taslim Murad,Prakash Chourasia,Sarwan Ali,Murray Patterson
発行日 2024-09-10 17:55:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-bio.QM パーマリンク