CohortFinder: an open-source tool for data-driven partitioning of biomedical image cohorts to yield robust machine learning models

要約

バッチ効果 (BE) とは、生物学的変動とは関係のないデータ収集における体系的な技術的差異を指し、そのノイズが機械学習 (ML) モデルの一般化性に悪影響を与えることが示されています。
ここでは、データ駆動型のコホート分割を通じて BE を軽減することを目的としたオープンソース ツールである CohortFinder をリリースします。
CohortFinder が下流の医療画像処理タスクにおける ML モデルのパフォーマンスを向上させることを実証します。
CohortFinder は、cohortfinder.com から無料でダウンロードできます。

要約(オリジナル)

Batch effects (BEs) refer to systematic technical differences in data collection unrelated to biological variations whose noise is shown to negatively impact machine learning (ML) model generalizability. Here we release CohortFinder, an open-source tool aimed at mitigating BEs via data-driven cohort partitioning. We demonstrate CohortFinder improves ML model performance in downstream medical image processing tasks. CohortFinder is freely available for download at cohortfinder.com.

arxiv情報

著者 Fan Fan,Georgia Martinez,Thomas Desilvio,John Shin,Yijiang Chen,Bangchen Wang,Takaya Ozeki,Maxime W. Lafarge,Viktor H. Koelzer,Laura Barisoni,Anant Madabhushi,Satish E. Viswanath,Andrew Janowczyk
発行日 2023-07-17 17:34:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク