Empowering Clinicians and Democratizing Data Science: Large Language Models Automate Machine Learning for Clinical Studies


機械学習 (ML) 開発者 (データ サイエンティストなど) と実践者 (臨床医など) との間には知識のギャップが依然として存在しており、臨床データ分析における ML の最大限の活用が妨げられています。
私たちは、GPT-4 の拡張機能である chatGPT Advanced Data Analysis (ADA) がこのギャップを埋めて ML 分析を効率的に実行できる可能性を調査しました。
さまざまな医療専門分野にわたる大規模試験から得られた実際の臨床データセットと研究の詳細が、特別なガイダンスなしで chatGPT ADA に提示されました。
ChatGPT ADA は、元の研究のトレーニング データに基づいて最先端の ML モデルを自律的に開発し、がんの発症、がんの進行、疾患の合併症、または病原性遺伝子配列などのバイオマーカーなどの臨床転帰を予測しました。
驚くべきことに、これらの ML モデルは、公開されているモデルと同等かそれを上回っていました。
私たちは、chatGPT ADA が医療における ML の民主化への有望な手段を提供し、ML 専門家以外のユーザーも高度な分析にアクセスできるようにし、医療研究と実践における幅広い応用を促進すると結論付けています。


A knowledge gap persists between Machine Learning (ML) developers (e.g., data scientists) and practitioners (e.g., clinicians), hampering the full utilization of ML for clinical data analysis. We investigated the potential of the chatGPT Advanced Data Analysis (ADA), an extension of GPT-4, to bridge this gap and perform ML analyses efficiently. Real-world clinical datasets and study details from large trials across various medical specialties were presented to chatGPT ADA without specific guidance. ChatGPT ADA autonomously developed state-of-the-art ML models based on the original study’s training data to predict clinical outcomes such as cancer development, cancer progression, disease complications, or biomarkers such as pathogenic gene sequences. Strikingly, these ML models matched or outperformed their published counterparts. We conclude that chatGPT ADA offers a promising avenue to democratize ML in medicine, making advanced analytics accessible to non-ML experts and promoting broader applications in medical research and practice.


著者 Soroosh Tayebi Arasteh,Tianyu Han,Mahshad Lotfinia,Christiane Kuhl,Jakob Nikolas Kather,Daniel Truhn,Sven Nebelung
発行日 2023-08-29 17:52:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク