要約
疫学では、予測因子と健康転帰との関連性を調査するために、ロジスティック回帰、線形回帰、その他のパラメトリック モデルなどの伝統的な統計手法が一般的に使用されます。
ただし、ディープ ニューラル ネットワーク (DNN) などのノンパラメトリック機械学習手法と説明可能な AI (XAI) ツールを組み合わせることで、このタスクに新たな機会が提供されます。
これらの手法は潜在的な可能性があるにもかかわらず、この分野では高品質かつ大量のデータの入手が限られているため、課題に直面しています。
これらの課題に対処するために、ドメイン固有の知識の一般的な形式であるプール効果サイズ (PES) を活用する、情報に基づいた DNN のための新しいアプローチである SEANN を紹介します。
PES は、公開されているメタアナリシス研究でさまざまな形式で一般的に見られ、科学的合意の定量的な形式を表します。
カスタム損失を使用した学習手順内での直接統合により、希少でノイズの多いデータ設定におけるドメイン知識非依存ニューラル ネットワークと比較して、予測パフォーマンスの一般化可能性と抽出された関係の科学的妥当性が大幅に向上することを実験的に実証しました。
要約(オリジナル)
In epidemiology, traditional statistical methods such as logistic regression, linear regression, and other parametric models are commonly employed to investigate associations between predictors and health outcomes. However, non-parametric machine learning techniques, such as deep neural networks (DNNs), coupled with explainable AI (XAI) tools, offer new opportunities for this task. Despite their potential, these methods face challenges due to the limited availability of high-quality, high-quantity data in this field. To address these challenges, we introduce SEANN, a novel approach for informed DNNs that leverages a prevalent form of domain-specific knowledge: Pooled Effect Sizes (PES). PESs are commonly found in published Meta-Analysis studies, in different forms, and represent a quantitative form of a scientific consensus. By direct integration within the learning procedure using a custom loss, we experimentally demonstrate significant improvements in the generalizability of predictive performances and the scientific plausibility of extracted relationships compared to a domain-knowledge agnostic neural network in a scarce and noisy data setting.
arxiv情報
著者 | Jean-Baptiste Guimbaud,Marc Plantevit,Léa Maître,Rémy Cazabet |
発行日 | 2025-01-17 16:01:05+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google