要約
細胞内タンパク質の自動視覚的局在化は、健康と病気における細胞機能の理解を加速することができます。
機械学習(ML)の最近の進歩にもかかわらず、人間は依然として多様な視覚的手がかりを使用することによって優れた精度を達成しています。
(i)セルアノテーション品質の自動改善、(ii)不均衡でノイズの多いデータをサポートする新しいディープニューラルネットワーク(DNN)アーキテクチャ、(iii)情報に基づく選択と融合の3つの主要な側面に対処することで、このギャップをどのように狭めることができるかを示します。
複数の多様な機械学習モデル。
弱いラベルの品質を改善するための新しい「AI-trains-AI」メソッドを紹介し、ウェーブレットフィルターとワイブルアクティベーションを活用する新しいDNNアーキテクチャを提案します。
また、画像レベルとセルレベルの予測間の相関関係を分析することにより、マルチDNNアンサンブルプロセスの重要な要素を調査します。
最後に、Human Protein Atlasのコンテキストで、一般化能力を強化しながら、私たちのシステムがタンパク質局在パターンのマルチラベル単一細胞分類で最先端のパフォーマンスを達成することを示します。
要約(オリジナル)
Automated visual localisation of subcellular proteins can accelerate our understanding of cell function in health and disease. Despite recent advances in machine learning (ML), humans still attain superior accuracy by using diverse visual cues. We show how this gap can be narrowed by addressing three key aspects: (i) automated improvement of cell annotation quality, (ii) new Deep Neural Network (DNN) architectures supporting unbalanced and noisy data, and (iii) informed selection and fusion of multiple & diverse machine learning models. We introduce a new “AI-trains-AI” method for improving the quality of weak labels and propose novel DNN architectures exploiting wavelet filters and Weibull activations. We also explore key factors in the multi-DNN ensembling process by analysing correlations between image-level and cell-level predictions. Finally, in the context of the Human Protein Atlas, we demonstrate that our system achieves state-of-the-art performance in the multi-label single-cell classification of protein localisation patterns, while strengthening generalisation ability.
arxiv情報
著者 | Syed Sameed Husain,Eng-Jon Ong,Dmitry Minskiy,Mikel Bober-Irizar,Amaia Irizar,Miroslaw Bober |
発行日 | 2022-06-28 11:46:23+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google