Efficient Large Scale Medical Image Dataset Preparation for Machine Learning Applications

要約

急速に進化する医療画像分野では、診断精度を高めるために機械学習アルゴリズムが不可欠になっています。
ただし、これらのアルゴリズムの有効性は、高品質の医療画像データセットの利用可能性と構成に依存します。
従来の Digital Imaging and Communications in Medicine (DICOM) データ管理システムは、機械学習アルゴリズムでの促進に必要なデータの規模と複雑さを処理するには不十分です。
このペーパーでは、大規模な医療画像データセットの編成、管理、処理を合理化することを目的として、Kaapana オープンソース ツールキットの一部として開発された革新的なデータ キュレーション ツールを紹介します。
このツールは、放射線科医や機械学習研究者のニーズを満たすように特別に調整されています。
高度な検索、自動注釈、効率的なタグ付け機能が組み込まれており、データキュレーションが向上します。
さらに、このツールは品質管理とレビューを容易にし、研究者が大規模なデータセットで画像とセグメンテーションの品質を検証できるようにします。
また、メタデータを集約して視覚化することで、データセット内の潜在的なバイアスを明らかにする上でも重要な役割を果たします。これは、堅牢な機械学習モデルの開発に不可欠です。
さらに、Kaapana は放射線医学協力ネットワーク (RACOON) に統合されています。これは、ドイツ全土のすべての大学の診療所にわたる放射線データの集約、送信、統合のための包括的な国内インフラストラクチャを構築することを目的とした先駆的な取り組みです。
このツールの機能を紹介する補足ビデオには、https://bit.ly/MICCAI-DEMI2023 からアクセスできます。

要約(オリジナル)

In the rapidly evolving field of medical imaging, machine learning algorithms have become indispensable for enhancing diagnostic accuracy. However, the effectiveness of these algorithms is contingent upon the availability and organization of high-quality medical imaging datasets. Traditional Digital Imaging and Communications in Medicine (DICOM) data management systems are inadequate for handling the scale and complexity of data required to be facilitated in machine learning algorithms. This paper introduces an innovative data curation tool, developed as part of the Kaapana open-source toolkit, aimed at streamlining the organization, management, and processing of large-scale medical imaging datasets. The tool is specifically tailored to meet the needs of radiologists and machine learning researchers. It incorporates advanced search, auto-annotation and efficient tagging functionalities for improved data curation. Additionally, the tool facilitates quality control and review, enabling researchers to validate image and segmentation quality in large datasets. It also plays a critical role in uncovering potential biases in datasets by aggregating and visualizing metadata, which is essential for developing robust machine learning models. Furthermore, Kaapana is integrated within the Radiological Cooperative Network (RACOON), a pioneering initiative aimed at creating a comprehensive national infrastructure for the aggregation, transmission, and consolidation of radiological data across all university clinics throughout Germany. A supplementary video showcasing the tool’s functionalities can be accessed at https://bit.ly/MICCAI-DEMI2023.

arxiv情報

著者 Stefan Denner,Jonas Scherer,Klaus Kades,Dimitrios Bounias,Philipp Schader,Lisa Kausch,Markus Bujotzek,Andreas Michael Bucher,Tobias Penzkofer,Klaus Maier-Hein
発行日 2023-09-29 14:41:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク