An Effective Transformer-based Solution for RSNA Intracranial Hemorrhage Detection Competition

要約

RSNA-IHDコンペティション(2019)における優勝解の性能を上回る、頭蓋内出血検出(IHD)の有効な手法を発表する。一方、我々のモデルは優勝者ソリューションと比較して、4分の1のパラメータと10%のFLOPsしか必要としない。IHDタスクは、入力された脳CTに対して、各スライスの出血カテゴリーを予測する必要があります。2019年に北米放射線学会(RSNA)が開催したIHDコンペティションの上位5ソリューションをレビューします。上位ソリューションのほぼ全てが、2次元畳み込みネットワークと逐次モデル(Bidirectional GRUまたはLSTM)に依存して、それぞれスライス内特徴とスライス間特徴を抽出しています。また、すべての上位ソリューションがモデルアンサンブルを利用して性能を高めており、モデル数は7~31種類と多岐にわたっています。過去数年間、コンピュータビジョンの領域、特にTransformerベースのモデルで多くの進歩があったので、我々はIHDタスクのためのスライス内およびスライス間ビューの特徴を抽出するTransformerベースの技術を導入する。さらに、半教師付き手法をワークフローに組み込むことで、さらなる性能向上を図っている。コードは原稿に掲載されています。

要約(オリジナル)

We present an effective method for Intracranial Hemorrhage Detection (IHD) which exceeds the performance of the winner solution in RSNA-IHD competition (2019). Meanwhile, our model only takes quarter parameters and ten percent FLOPs compared to the winner’s solution. The IHD task needs to predict the hemorrhage category of each slice for the input brain CT. We review the top-5 solutions for the IHD competition held by the Radiological Society of North America(RSNA) in 2019. Nearly all the top solutions rely on 2D convolutional networks and sequential models (Bidirectional GRU or LSTM) to extract intra-slice and inter-slice features, respectively. All the top solutions enhance the performance by leveraging the model ensemble, and the model number varies from 7 to 31. In the past years, since much progress has been made in the computer vision regime especially Transformer-based models, we introduce the Transformer-based techniques to extract the features in both intra-slice and inter-slice views for IHD tasks. Additionally, a semi-supervised method is embedded into our workflow to further improve the performance. The code is available in the manuscript.

arxiv情報

著者 Fangxin Shang,Siqi Wang,Xiaorong Wang,Yehui Yang
発行日 2022-06-07 03:54:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク