Weakly Supervised Airway Orifice Segmentation in Video Bronchoscopy

要約

ビデオ気管支鏡検査は、がんが疑われる肺組織の生検、COPD 患者のモニタリング、および集中治療室での急性呼吸器疾患の解明のために日常的に実施されています。
複雑な気管支樹内のナビゲーションは、医師の長期的な経験を必要とする、特に挑戦的で肉体的に厳しいものです。
この論文では、気管支鏡検査ビデオにおける気管支口の自動セグメンテーションについて説明します。
このタスクに対する深層学習ベースのアプローチは、すぐに利用できるグラウンド トゥルース セグメンテーション データが不足しているため、現在妨げられています。
したがって、k-means とそれに続くコンパクトなマーカーベースの流域アルゴリズムで構成されるデータ駆動型パイプラインを提示します。これにより、指定された深度画像から気道インスタンス セグメンテーション マップを生成できます。
このように、これらの従来のアルゴリズムは、ファントム データセットのみに基づいて RGB 画像で浅い CNN を直接トレーニングするための弱い監視として機能します。
21 の異なる気管支鏡検査で 250 フレームをカバーする 2 つの生体内データセットで、このモデルの一般化機能を評価します。
そのパフォーマンスは、生体内データで直接トレーニングされているモデルに匹敵し、128×128 の画像解像度で気道セグメンテーションの検出された中心に対して 11 対 5 ピクセルの平均誤差に達することを示しています。
私たちの定量的および定性的な結果は、ビデオ気管支鏡検査のコンテキストでは、非学習ベースのアプローチを使用したファントム データと弱い監督により、気道構造の意味的な理解を得ることができることを示しています。

要約(オリジナル)

Video bronchoscopy is routinely conducted for biopsies of lung tissue suspected for cancer, monitoring of COPD patients and clarification of acute respiratory problems at intensive care units. The navigation within complex bronchial trees is particularly challenging and physically demanding, requiring long-term experiences of physicians. This paper addresses the automatic segmentation of bronchial orifices in bronchoscopy videos. Deep learning-based approaches to this task are currently hampered due to the lack of readily-available ground truth segmentation data. Thus, we present a data-driven pipeline consisting of a k-means followed by a compact marker-based watershed algorithm which enables to generate airway instance segmentation maps from given depth images. In this way, these traditional algorithms serve as weak supervision for training a shallow CNN directly on RGB images solely based on a phantom dataset. We evaluate generalization capabilities of this model on two in-vivo datasets covering 250 frames on 21 different bronchoscopies. We demonstrate that its performance is comparable to those models being directly trained on in-vivo data, reaching an average error of 11 vs 5 pixels for the detected centers of the airway segmentation by an image resolution of 128×128. Our quantitative and qualitative results indicate that in the context of video bronchoscopy, phantom data and weak supervision using non-learning-based approaches enable to gain a semantic understanding of airway structures.

arxiv情報

著者 Ron Keuth,Mattias Heinrich,Martin Eichenlaub,Marian Himstedt
発行日 2022-08-24 12:18:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク