要約
コンピューター ビジョンの基礎モデルは、自己教師付き事前トレーニング手法を通じて大規模なデータセットから多目的特徴を抽出することにより、ゼロショット タスクや少数ショット タスクで優れたパフォーマンスを実証しました。
ただし、これらのモデルでは、高レベルのノイズによる極低温電子顕微鏡 (cryo-EM) 画像の重大な破損が見落とされることがよくあります。
Noise2Noise (N2N) アプローチからインスピレーションを得た、CryO-EM 用のノイズ除去・再構成オートエンコーダーである DRACO を紹介します。
クライオ EM ムービーを奇数画像と偶数画像に処理し、それらを独立したノイズの多い観察として扱うことで、ノイズ除去と再構成のハイブリッド トレーニング スキームを適用します。
両方の画像をマスクして、ノイズ除去タスクと再構成タスクを作成します。
DRACO の事前トレーニングでは、データセットの品質が不可欠であるため、270,000 を超えるムービーや顕微鏡写真を含む、厳選されていない公開データベースから高品質で多様なデータセットを構築します。
事前トレーニング後、DRACO は当然ながら、一般化可能なクライオ EM 画像ノイズ除去装置およびさまざまなクライオ EM ダウンストリーム タスクの基礎モデルとして機能します。
DRACO は、最先端のベースラインと比較して、ノイズ除去、顕微鏡写真のキュレーション、粒子ピッキングのタスクにおいて最高のパフォーマンスを示します。
要約(オリジナル)
Foundation models in computer vision have demonstrated exceptional performance in zero-shot and few-shot tasks by extracting multi-purpose features from large-scale datasets through self-supervised pre-training methods. However, these models often overlook the severe corruption in cryogenic electron microscopy (cryo-EM) images by high-level noises. We introduce DRACO, a Denoising-Reconstruction Autoencoder for CryO-EM, inspired by the Noise2Noise (N2N) approach. By processing cryo-EM movies into odd and even images and treating them as independent noisy observations, we apply a denoising-reconstruction hybrid training scheme. We mask both images to create denoising and reconstruction tasks. For DRACO’s pre-training, the quality of the dataset is essential, we hence build a high-quality, diverse dataset from an uncurated public database, including over 270,000 movies or micrographs. After pre-training, DRACO naturally serves as a generalizable cryo-EM image denoiser and a foundation model for various cryo-EM downstream tasks. DRACO demonstrates the best performance in denoising, micrograph curation, and particle picking tasks compared to state-of-the-art baselines.
arxiv情報
著者 | Yingjun Shen,Haizhao Dai,Qihe Chen,Yan Zeng,Jiakai Zhang,Yuan Pei,Jingyi Yu |
発行日 | 2024-10-28 14:08:44+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google