要約
ディープラーニング (DL) ベースの肋骨骨折検出は、死亡率の予防と患者の転帰の改善に重要な役割を果たすことが期待されています。
通常、DL ベースのオブジェクト検出モデルを開発するには、膨大な量の境界ボックスのアノテーションが必要です。
ただし、医療データに注釈を付けるには時間がかかり、専門知識が必要となるため、きめの細かい注釈を大量に取得することは非常に困難です。
このため、放射線科医のラベル付けの負担を軽減するために、ラベル効率の良い検出モデルを開発することが差し迫った必要性となっています。
この課題に取り組むために、物体検出の文献では、弱教師ありおよび半教師ありのアプローチが増加していますが、完全ラベル付き、弱ラベル付き、およびラベルなしのさまざまな形式のデータを活用する統一フレームワークがまだ不足しています。
この論文では、可能な限り多くの利用可能な監視を活用するための、新しい全監視型物体検出ネットワーク ORF-Netv2 を紹介します。
具体的には、マルチブランチオムニ監視型検出ヘッドが導入され、各ブランチが特定のタイプの監視でトレーニングされます。
次に、弱くラベル付けされたデータとラベル付けされていないデータからの柔軟かつ堅牢な学習を可能にする、共トレーニングベースの動的ラベル割り当て戦略が提案されます。
提案されたフレームワークについて、胸部 CT と X 線の両方で 3 つの肋骨骨折データセットを使用して広範な評価が行われました。
あらゆる形式の監視を活用することで、ORF-Netv2 は 3 つのデータセットでそれぞれ 34.7、44.7、および 19.4 の mAP を達成し、ボックス アノテーションのみを使用するベースライン検出器を、それぞれ 3.8、4.8、および 5.0 の mAP ゲインで上回りました。
さらに、ORF-Netv2 は、さまざまなシナリオにわたって他の競合するラベル効率の高い手法を常に上回っており、ラベル効率の高い破損検出の有望なフレームワークを示しています。
要約(オリジナル)
Deep learning (DL)-based rib fracture detection has shown promise of playing an important role in preventing mortality and improving patient outcome. Normally, developing DL-based object detection models requires huge amount of bounding box annotation. However, annotating medical data is time-consuming and expertise-demanding, making obtaining a large amount of fine-grained annotations extremely infeasible. This poses pressing need of developing label-efficient detection models to alleviate radiologists’ labeling burden. To tackle this challenge, the literature of object detection has witnessed an increase of weakly-supervised and semi-supervised approaches, yet still lacks a unified framework that leverages various forms of fully-labeled, weakly-labeled, and unlabeled data. In this paper, we present a novel omni-supervised object detection network, ORF-Netv2, to leverage as much available supervision as possible. Specifically, a multi-branch omni-supervised detection head is introduced with each branch trained with a specific type of supervision. A co-training-based dynamic label assignment strategy is then proposed to enable flexibly and robustly learning from the weakly-labeled and unlabeled data. Extensively evaluation was conducted for the proposed framework with three rib fracture datasets on both chest CT and X-ray. By leveraging all forms of supervision, ORF-Netv2 achieves mAPs of 34.7, 44.7, and 19.4 on the three datasets, respectively, surpassing the baseline detector which uses only box annotations by mAP gains of 3.8, 4.8, and 5.0, respectively. Furthermore, ORF-Netv2 consistently outperforms other competitive label-efficient methods over various scenarios, showing a promising framework for label-efficient fracture detection.
arxiv情報
著者 | Zhizhong Chai,Luyang Luo,Huangjing Lin,Pheng-Ann Heng,Hao Chen |
発行日 | 2023-06-23 05:36:03+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google