要約
大規模な参加型生物医学研究、つまりデータセットに参加する個人を募集する研究は、特に最新のAI手法による分析において、人気と投資を集めている。参加者を意図的に募集するため、このような研究は、多くの生物医学データセットに影響を及ぼしている問題である、歴史的な代表性の欠如にユニークに対処することができる。この研究では、代表性をある属性の集合の目標集団分布との類似性と定義し、我々の目標は年齢、性別、人種、民族の分布にわたって米国集団を反映することである。多くの参加型研究は複数の施設で募集を行うので、代表性を向上させるために施設間で募集資源を適応的に配分する計算アプローチを導入する。STAR Clinical Research Networkの医療センターから10,000人の参加者コホートの募集をシミュレートしたところ、我々のアプローチは既存のベースラインよりも代表的なコホートが得られることが示された。このように、我々は、募集活動を導くための計算モデリングの価値を強調している。
要約(オリジナル)
Large participatory biomedical studies, studies that recruit individuals to join a dataset, are gaining popularity and investment, especially for analysis by modern AI methods. Because they purposively recruit participants, these studies are uniquely able to address a lack of historical representation, an issue that has affected many biomedical datasets. In this work, we define representativeness as the similarity to a target population distribution of a set of attributes and our goal is to mirror the U.S. population across distributions of age, gender, race, and ethnicity. Many participatory studies recruit at several institutions, so we introduce a computational approach to adaptively allocate recruitment resources among sites to improve representativeness. In simulated recruitment of 10,000-participant cohorts from medical centers in the STAR Clinical Research Network, we show that our approach yields a more representative cohort than existing baselines. Thus, we highlight the value of computational modeling in guiding recruitment efforts.
arxiv情報
著者 | Victor Borza,Andrew Estornell,Ellen Wright Clayton,Chien-Ju Ho,Russell Rothman,Yevgeniy Vorobeychik,Bradley Malin |
発行日 | 2024-08-02 16:32:30+00:00 |
arxivサイト | arxiv_id(pdf) |