LEAVS: An LLM-based Labeler for Abdominal CT Supervision

要約

放射線レポートから構造化されたラベルの抽出が採用されており、視力モデルを作成して、いくつかのタイプの異常を同時に検出しています。
ただし、既存の作業は主に胸部に焦点を当てています。
より複雑な解剖学と腹部のより広い範囲の病理学のために、腹部放射線報告で調査された研究はほとんどありません。
Leavsを提案します(腹部視力監督のための大規模な言語モデル抽出器)。
このラベル付けは、CT放射線科レポートで9つの腹部臓器の存在の確実性と7種類の異常の緊急性に注釈を付けることができます。
幅広いカバレッジを確保するために、CTレポートのほとんどの発見タイプを含む異常を選択しました。
私たちのアプローチでは、樹木ベースの決定システムで文抽出と複数選択の質問を使用して、ローカルランLLMの専門的なチェーン促進プロンプト戦略を採用しています。
LLMは、平均F1スコアが0.89の腹部臓器全体でいくつかの異常タイプを抽出し、競合するラベル付け器と人間を大幅に上回ることができることを実証します。
さらに、緊急ラベルの抽出が人間の注釈に匹敵するパフォーマンスを達成したことを示しています。
最後に、異常ラベルには、いくつかの臓器を正常または異常として分類する単一のビジョンモデルをトレーニングするための貴重な情報が含まれていることを実証します。
1,000 ctを超えるボリュームを含むパブリックCTデータセットのコードと構造的な注釈をリリースします。

要約(オリジナル)

Extracting structured labels from radiology reports has been employed to create vision models to simultaneously detect several types of abnormalities. However, existing works focus mainly on the chest region. Few works have been investigated on abdominal radiology reports due to more complex anatomy and a wider range of pathologies in the abdomen. We propose LEAVS (Large language model Extractor for Abdominal Vision Supervision). This labeler can annotate the certainty of presence and the urgency of seven types of abnormalities for nine abdominal organs on CT radiology reports. To ensure broad coverage, we chose abnormalities that encompass most of the finding types from CT reports. Our approach employs a specialized chain-of-thought prompting strategy for a locally-run LLM using sentence extraction and multiple-choice questions in a tree-based decision system. We demonstrate that the LLM can extract several abnormality types across abdominal organs with an average F1 score of 0.89, significantly outperforming competing labelers and humans. Additionally, we show that extraction of urgency labels achieved performance comparable to human annotations. Finally, we demonstrate that the abnormality labels contain valuable information for training a single vision model that classifies several organs as normal or abnormal. We release our code and structured annotations for a public CT dataset containing over 1,000 CT volumes.

arxiv情報

著者 Ricardo Bigolin Lanfredi,Yan Zhuang,Mark Finkelstein,Praveen Thoppey Srinivasan Balamuralikrishna,Luke Krembs,Brandon Khoury,Arthi Reddy,Pritam Mukherjee,Neil M. Rofsky,Ronald M. Summers
発行日 2025-03-17 16:09:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, eess.IV パーマリンク