Methods for generating and evaluating synthetic longitudinal patient data: a systematic review

要約

データ可用性の急速な成長により研究開発が促進されましたが、法的制約やプライバシー上の制約により、すべての業界が平等に恩恵を受けているわけではありません。
医療分野は、データのセキュリティと機密性への懸念により、患者データの活用において大きな課題に直面しています。
これに対処するために、合成データの生成を含むさまざまなプライバシー保護方法が提案されています。
合成データは既存のデータを可能な限り厳密に複製し、機密情報のプロキシとして機能します。
患者データは縦断的なものであることが多いですが、医療における合成データ生成に関する既存のレビューでは、この側面は依然として過小評価されています。
この論文は、PRISMA ガイドラインに従って実施され、2024 年 5 月までの 5 つのデータベースからのデータを組み込んだ体系的な文献レビューを通じて、実際の環境で合成の縦断的患者データを生成および評価する方法をマッピングして説明しています。39 の方法が特定され、そのうち 4 つは
長期的なデータ生成のすべての課題に対処していますが、プライバシー保護メカニズムは含まれていませんでした。
ほとんどの研究では類似性が評価され、大部分で実用性が評価され、半数強でプライバシーが評価されました。
3 つの側面すべてを評価した研究はほんの一部でした。
私たちの調査結果は、この分野におけるさらなる研究の必要性を浮き彫りにしています。

要約(オリジナル)

The rapid growth in data availability has facilitated research and development, yet not all industries have benefited equally due to legal and privacy constraints. The healthcare sector faces significant challenges in utilizing patient data because of concerns about data security and confidentiality. To address this, various privacy-preserving methods, including synthetic data generation, have been proposed. Synthetic data replicate existing data as closely as possible, acting as a proxy for sensitive information. While patient data are often longitudinal, this aspect remains underrepresented in existing reviews of synthetic data generation in healthcare. This paper maps and describes methods for generating and evaluating synthetic longitudinal patient data in real-life settings through a systematic literature review, conducted following the PRISMA guidelines and incorporating data from five databases up to May 2024. Thirty-nine methods were identified, with four addressing all challenges of longitudinal data generation, though none included privacy-preserving mechanisms. Resemblance was evaluated in most studies, utility in the majority, and privacy in just over half. Only a small fraction of studies assessed all three aspects. Our findings highlight the need for further research in this area.

arxiv情報

著者 Katariina Perkonoja,Kari Auranen,Joni Virta
発行日 2024-12-02 12:36:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CR, cs.LG, stat.AP, stat.ME パーマリンク