Medical artificial intelligence toolbox (MAIT): an explainable machine learning framework for binary classification, survival modelling, and regression analyses

要約

機械学習は、さまざまな医学研究の疑問を探求するのに適した多様な技術を提供しますが、一貫した相乗効果のあるフレームワークにより、統一されたモデルの開発と解釈における新しいアプローチの統合と理解を促進できます。
そこで、表形式のデータセットでバイナリ分類、回帰、生存モデルを開発および評価するための説明可能なオープンソース Python パイプラインである Medical Artificial Intelligence Toolbox (MAIT) を紹介します。
MAIT は、レポートの透明性を促進しながら (TRIPOD+AI 準拠)、主要な課題 (高次元性、クラスの不均衡、混合変数タイプ、欠落など) に対処します。
MAIT は、初心者向けの自動構成と専門家向けのカスタマイズ可能なソース コードを提供し、発見 (統合スコアリングによる機能の重要性、たとえば SHapley Additive exPlanations – SHAP) と予測 (最適化されたソリューションによるモデルの開発と展開) という 2 つの主要なユースケースを合理化します。
さらに、MAIT は、バイナリ分類における確率しきい値の微調整、バイナリ分類への累積ハザード曲線の変換、混合データ型のモデル解釈のための強化された視覚化、半教師あり学習による打ち切りの処理など、幅広い環境に適応するための新しい技術を提案しています。
データ制約と研究デザインのセット。
医学研究における ML モデルの実装と解釈を改善するために MAIT を使用する方法を示すために、4 つのオープンアクセス データ セットを使用した詳細なチュートリアルを GitHub で提供しています。

要約(オリジナル)

While machine learning offers diverse techniques suitable for exploring various medical research questions, a cohesive synergistic framework can facilitate the integration and understanding of new approaches within unified model development and interpretation. We therefore introduce the Medical Artificial Intelligence Toolbox (MAIT), an explainable, open-source Python pipeline for developing and evaluating binary classification, regression, and survival models on tabular datasets. MAIT addresses key challenges (e.g., high dimensionality, class imbalance, mixed variable types, and missingness) while promoting transparency in reporting (TRIPOD+AI compliant). Offering automated configurations for beginners and customizable source code for experts, MAIT streamlines two primary use cases: Discovery (feature importance via unified scoring, e.g., SHapley Additive exPlanations – SHAP) and Prediction (model development and deployment with optimized solutions). Moreover, MAIT proposes new techniques including fine-tuning of probability threshold in binary classification, translation of cumulative hazard curves to binary classification, enhanced visualizations for model interpretation for mixed data types, and handling censoring through semi-supervised learning, to adapt to a wide set of data constraints and study designs. We provide detailed tutorials on GitHub, using four open-access data sets, to demonstrate how MAIT can be used to improve implementation and interpretation of ML models in medical research.

arxiv情報

著者 Ramtin Zargari Marandi,Anne Svane Frahm,Jens Lundgren,Daniel Dawson Murray,Maja Milojevic
発行日 2025-01-08 14:51:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク