Landmark Detection using Transformer Toward Robot-assisted Nasal Airway Intubation

要約

ロボット支援による気道挿管アプリケーションでは、ターゲットと臓器の位置を高精度で特定する必要があります。
鼻孔と声門という 2 つの重要なランドマークは、経鼻挿管の段階に対応するために挿管中に検出できます。
自動化されたランドマーク検出により、正確な位置特定と定量的評価が可能になります。
Detection Transformer (DeTR) は、物体検出器を長距離依存性のある新しいパラダイムに導きます。
しかし、現在の DeTR は収束するまでに長い反復が必要であり、小さな物体の検出には十分な性能がありません。
この論文では、ロボット支援挿管におけるランドマークを検出するための、変形可能な DeTR とセマンティック整合マッチング モジュールを備えたトランスベースのランドマーク検出ソリューションを提案します。
セマンティクス アライナーは、最も識別力の高い特徴を使用して、同じ埋め込み空間内のオブジェクト クエリと画像特徴のセマンティクスを効果的に調整できます。
ソリューションのパフォーマンスを評価するために、公的にアクセス可能な声門データセットを利用し、鼻孔検出データセットに自動的に注釈を付けます。
実験結果は、検出精度における当社の競争力のあるパフォーマンスを示しています。
私たちのコードは公開されています。

要約(オリジナル)

Robot-assisted airway intubation application needs high accuracy in locating targets and organs. Two vital landmarks, nostrils and glottis, can be detected during the intubation to accommodate the stages of nasal intubation. Automated landmark detection can provide accurate localization and quantitative evaluation. The Detection Transformer (DeTR) leads object detectors to a new paradigm with long-range dependence. However, current DeTR requires long iterations to converge, and does not perform well in detecting small objects. This paper proposes a transformer-based landmark detection solution with deformable DeTR and the semantic-aligned-matching module for detecting landmarks in robot-assisted intubation. The semantics aligner can effectively align the semantics of object queries and image features in the same embedding space using the most discriminative features. To evaluate the performance of our solution, we utilize a publicly accessible glottis dataset and automatically annotate a nostril detection dataset. The experimental results demonstrate our competitive performance in detection accuracy. Our code is publicly accessible.

arxiv情報

著者 Tianhang Liu,Hechen Li,Long Bai,Yanan Wu,An Wang,Mobarakol Islam,Hongliang Ren
発行日 2023-08-05 11:14:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO, eess.IV パーマリンク