Deblurring Masked Autoencoder is Better Recipe for Ultrasound Image Recognition


マスク オートエンコーダ (MAE) は前例のない注目を集めており、多くの視覚タスクで顕著なパフォーマンスを達成しています。
事前トレーニング中にランダムなマスクされた画像パッチ (プロキシ タスクと呼ばれる) を再構築し、下流のタスクに転送できる意味のある意味表現を学習します。
ただし、MAE は超音波画像法では十分に研究されていません。
この研究では、超音波画像認識における MAE の可能性を調査します。
高いノイズ対信号比における超音波イメージングのユニークな特性を動機として、事前トレーニング中のプロキシ タスクにブレ除去を組み込む新しいブレ除去 MAE アプローチを提案します。
当社の実験結果は、当社のブレ除去 MAE の有効性を実証し、超音波画像分類において最先端のパフォーマンスを達成しています。
全体として、私たちの研究は超音波画像認識における MAE の可能性を強調し、その有効性をさらに向上させるためにブレ除去を組み込んだ新しいアプローチを提示しています。


Masked autoencoder (MAE) has attracted unprecedented attention and achieves remarkable performance in many vision tasks. It reconstructs random masked image patches (known as proxy task) during pretraining and learns meaningful semantic representations that can be transferred to downstream tasks. However, MAE has not been thoroughly explored in ultrasound imaging. In this work, we investigate the potential of MAE for ultrasound image recognition. Motivated by the unique property of ultrasound imaging in high noise-to-signal ratio, we propose a novel deblurring MAE approach that incorporates deblurring into the proxy task during pretraining. The addition of deblurring facilitates the pretraining to better recover the subtle details presented in the ultrasound images, thus improving the performance of the downstream classification task. Our experimental results demonstrate the effectiveness of our deblurring MAE, achieving state-of-the-art performance in ultrasound image classification. Overall, our work highlights the potential of MAE for ultrasound image recognition and presents a novel approach that incorporates deblurring to further improve its effectiveness.


著者 Qingbo Kang,Jun Gao,Kang Li,Qicheng Lao
発行日 2023-07-13 08:33:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV パーマリンク