要約
本論文では、胃がん画像のグローバルな自動検出を可能にする胃病理組織画像検出(GHID)のためのマルチスケール視覚変換モデル(GasHis-Transformer)を提案する。GasHis-Transformerは、位置符号化変換器と局所畳み込みニューラルネットワークを用いて、それぞれグローバル情報とローカル情報を抽出するように設計された2つの主要モジュールから構成されている。実験には、一般に公開されているヘマトキシリン・エオジン(H&E)染色された胃の病理組織画像データセットを用いている。さらに、信頼性を向上させた臨床応用のために、GasHis-Transformerのモデルサイズと学習時間を削減するDropconnectベースの軽量ネットワークが提案されている。さらに、一連の対比実験と拡張実験により、GasHis-Transformerの頑健性、拡張性、安定性を検証している。結論として、GasHis-Transformerは高いグローバルな検出性能を示し、GHIDタスクにおける重要な可能性を示している。
要約(オリジナル)
In this paper, a multi-scale visual transformer model, referred as GasHis-Transformer, is proposed for Gastric Histopathological Image Detection (GHID), which enables the automatic global detection of gastric cancer images. GasHis-Transformer model consists of two key modules designed to extract global and local information using a position-encoded transformer model and a convolutional neural network with local convolution, respectively. A publicly available hematoxylin and eosin (H&E) stained gastric histopathological image dataset is used in the experiment. Furthermore, a Dropconnect based lightweight network is proposed to reduce the model size and training time of GasHis-Transformer for clinical applications with improved confidence. Moreover, a series of contrast and extended experiments verify the robustness, extensibility and stability of GasHis-Transformer. In conclusion, GasHis-Transformer demonstrates high global detection performance and shows its significant potential in GHID task.
arxiv情報
著者 | Haoyuan Chen,Chen Li,Ge Wang,Xiaoyan Li,Md Rahaman,Hongzan Sun,Weiming Hu,Yixin Li,Wanli Liu,Changhao Sun,Shiliang Ai,Marcin Grzegorzek |
発行日 | 2022-06-08 11:26:17+00:00 |
arxivサイト | arxiv_id(pdf) |