Towards Understanding the Survival of Patients with High-Grade Gastroenteropancreatic Neuroendocrine Neoplasms: An Investigation of Ensemble Feature Selection in the Prediction of Overall Survival

要約

高悪性度の胃腸膵臓神経内分泌腫瘍と診断された患者の全生存を予測するための最も有益な特徴を決定することは、患者の個々の治療計画を改善し、疾患の生物学的理解を深めるために重要です。
Repeated Elastic Net Technique for Feature Selection (RENT) や User-Guided Bayesian Framework for Feature Selection (UBayFS) などの最近開発されたアンサンブル機能セレクターにより、ユーザーはサンプル サイズの小さいデータセットでそのような機能を識別できます。
RENT は純粋にデータ駆動型ですが、UBayFS は機能選択プロセスでアプリオリに専門知識を統合することができます。
この作業では、基本的な患者の特徴、ベースラインの血液値、腫瘍の組織学、画像、治療情報など、複数のソースからの 63 人の患者と 134 の特徴で構成されるデータセットの両方の特徴セレクターを比較します。
私たちの実験には、データ駆動型とエキスパート駆動型のセットアップ、および両方の組み合わせが含まれます。
私たちは、専門知識の情報源として臨床文献からの調査結果を使用します。
私たちの結果は、両方の機能セレクターが正確な予測を可能にし、専門知識が機能セットに安定化効果をもたらす一方で、予測パフォーマンスへの影響が限られていることを示しています。
機能 WHO パフォーマンス ステータス、アルブミン、血小板、Ki-67、腫瘍形態、総 MTV、総 TLG、および SUVmax は、私たちの研究で最も安定した予測機能です。

要約(オリジナル)

Determining the most informative features for predicting the overall survival of patients diagnosed with high-grade gastroenteropancreatic neuroendocrine neoplasms is crucial to improve individual treatment plans for patients, as well as the biological understanding of the disease. Recently developed ensemble feature selectors like the Repeated Elastic Net Technique for Feature Selection (RENT) and the User-Guided Bayesian Framework for Feature Selection (UBayFS) allow the user to identify such features in datasets with low sample sizes. While RENT is purely data-driven, UBayFS is capable of integrating expert knowledge a priori in the feature selection process. In this work we compare both feature selectors on a dataset comprising of 63 patients and 134 features from multiple sources, including basic patient characteristics, baseline blood values, tumor histology, imaging, and treatment information. Our experiments involve data-driven and expert-driven setups, as well as combinations of both. We use findings from clinical literature as a source of expert knowledge. Our results demonstrate that both feature selectors allow accurate predictions, and that expert knowledge has a stabilizing effect on the feature set, while the impact on predictive performance is limited. The features WHO Performance Status, Albumin, Platelets, Ki-67, Tumor Morphology, Total MTV, Total TLG, and SUVmax are the most stable and predictive features in our study.

arxiv情報

著者 Anna Jenul,Henning Langen Stokmo,Stefan Schrunner,Mona-Elisabeth Revheim,Geir Olav Hjortland,Oliver Tomic
発行日 2023-02-20 17:08:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク