GasHis-Transformer: A Multi-scale Visual Transformer Approach for Gastric Histopathological Image Detection

要約

本論文では、胃がん画像のグローバルな自動検出を可能にする胃病理組織画像検出(GHID)のためのマルチスケール視覚変換モデル(GasHis-Transformer)を提案する。GasHis-Transformerは、位置符号化変換器と局所畳み込みニューラルネットワークを用いて、それぞれグローバル情報とローカル情報を抽出するように設計された2つの主要モジュールから構成されている。実験には、一般に公開されているヘマトキシリン・エオジン(H&E)染色された胃の病理組織画像データセットを用いている。さらに、信頼性を向上させた臨床応用のために、GasHis-Transformerのモデルサイズと学習時間を削減するDropconnectベースの軽量ネットワークが提案されている。さらに、一連の対比実験と拡張実験により、GasHis-Transformerの頑健性、拡張性、安定性を検証している。結論として、GasHis-Transformerは高いグローバルな検出性能を示し、GHIDタスクにおける重要な可能性を示している。

要約(オリジナル)

In this paper, a multi-scale visual transformer model, referred as GasHis-Transformer, is proposed for Gastric Histopathological Image Detection (GHID), which enables the automatic global detection of gastric cancer images. GasHis-Transformer model consists of two key modules designed to extract global and local information using a position-encoded transformer model and a convolutional neural network with local convolution, respectively. A publicly available hematoxylin and eosin (H&E) stained gastric histopathological image dataset is used in the experiment. Furthermore, a Dropconnect based lightweight network is proposed to reduce the model size and training time of GasHis-Transformer for clinical applications with improved confidence. Moreover, a series of contrast and extended experiments verify the robustness, extensibility and stability of GasHis-Transformer. In conclusion, GasHis-Transformer demonstrates high global detection performance and shows its significant potential in GHID task.

arxiv情報

著者 Haoyuan Chen,Chen Li,Ge Wang,Xiaoyan Li,Md Rahaman,Hongzan Sun,Weiming Hu,Yixin Li,Wanli Liu,Changhao Sun,Shiliang Ai,Marcin Grzegorzek
発行日 2022-06-08 11:26:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク