Advancing human-centric AI for robust X-ray analysis through holistic self-supervised learning


AI Foundation モデルは、放射線医学などの医療分野を含むさまざまなアプリケーションで注目を集めています。
私たちは、873k 胸部 X 線写真の自己監視によってトレーニングされた大型ビジュアル エンコーダーである RayDINO を紹介します。
私たちは、分類や高密度セグメンテーションからテキスト生成まで、9 つの放射線学タスクにわたって、RayDINO を以前の最先端モデルと比較し、モデルの人口、年齢、性別のバイアスについて詳細な分析を提供します。
私たちの調査結果は、自己監視により患者中心の AI が臨床ワークフローで有用であることが証明され、X 線を総合的に解釈できることが示唆されています。
RayDINO と小さなタスク固有のアダプターを使用して、バイアスを軽減しながら最先端の結果を達成し、目に見えない集団への一般化を向上させ、基盤モデルの真の約束である汎用性と堅牢性を示しています。


AI Foundation models are gaining traction in various applications, including medical fields like radiology. However, medical foundation models are often tested on limited tasks, leaving their generalisability and biases unexplored. We present RayDINO, a large visual encoder trained by self-supervision on 873k chest X-rays. We compare RayDINO to previous state-of-the-art models across nine radiology tasks, from classification and dense segmentation to text generation, and provide an in depth analysis of population, age and sex biases of our model. Our findings suggest that self-supervision allows patient-centric AI proving useful in clinical workflows and interpreting X-rays holistically. With RayDINO and small task-specific adapters, we reach state-of-the-art results and improve generalization to unseen populations while mitigating bias, illustrating the true promise of foundation models: versatility and robustness.


著者 Théo Moutakanni,Piotr Bojanowski,Guillaume Chassagnon,Céline Hudelot,Armand Joulin,Yann LeCun,Matthew Muckley,Maxime Oquab,Marie-Pierre Revel,Maria Vakalopoulou
発行日 2024-05-02 16:59:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CV パーマリンク