要約
タイトル:オープンヘルスケアデータを通じて政策立案者に行動可能なトレンドを識別する技術「PIKS」
要約:
– 政府は透明性の向上を求め、金融、教育、ヘルスケアなどの多くの分野で大量のデータを公開しています。
– ヘルスケアデータの効率的な探索的分析は、大きな課題となっています。
– 公衆衛生において重要な懸念事項は、トレンドの迅速な特定と分析、外れ値の検出です。これにより、政策を迅速に変化に対応できます。
– PIKS(Pruned iterative-k means searchlight)と呼ばれる外れ値検出技術を紹介しました。これは、イテレーションk-meansアルゴリズムと、剪定されたサーチライトベースのスキャンを組み合わせたものです。
– この技術を、ニューヨーク州全体計画・研究協力システムとカリフォルニア州全体的な健康計画・開発事務所から提供された2つのヘルスケアデータセットに適用しました。自己符号化器、孤立した森、特徴バギングという3つの既存の外れ値検出技術と比較しました。
– PIKS技術は、自己符号化器と同様の結果をもたらしますが、自己符号化器はトレーニングが必要であり、いくつかのパラメータを調整する必要があります。これに対し、PIKS技術は調整するパラメータがはるかに少ないため、高速な「開封即食」のデータ探索に有利です。
– PIKS技術はスケーラブルであり、新しいデータセットを容易に取り込めます。したがって、市民、患者、政策立案者にとって貴重な最新の洞察を提供できます。
– オープンソースにコードを公開しており、オープンデータが利用可能なため、他の研究者は簡単に当社の作業を再現および拡張できます。これにより、ヘルスケアポリシーと公衆衛生問題に対するより深い理解が促進されます。
要約(オリジナル)
With calls for increasing transparency, governments are releasing greater amounts of data in multiple domains including finance, education and healthcare. The efficient exploratory analysis of healthcare data constitutes a significant challenge. Key concerns in public health include the quick identification and analysis of trends, and the detection of outliers. This allows policies to be rapidly adapted to changing circumstances. We present an efficient outlier detection technique, termed PIKS (Pruned iterative-k means searchlight), which combines an iterative k-means algorithm with a pruned searchlight based scan. We apply this technique to identify outliers in two publicly available healthcare datasets from the New York Statewide Planning and Research Cooperative System, and California’s Office of Statewide Health Planning and Development. We provide a comparison of our technique with three other existing outlier detection techniques, consisting of auto-encoders, isolation forests and feature bagging. We identified outliers in conditions including suicide rates, immunity disorders, social admissions, cardiomyopathies, and pregnancy in the third trimester. We demonstrate that the PIKS technique produces results consistent with other techniques such as the auto-encoder. However, the auto-encoder needs to be trained, which requires several parameters to be tuned. In comparison, the PIKS technique has far fewer parameters to tune. This makes it advantageous for fast, ‘out-of-the-box’ data exploration. The PIKS technique is scalable and can readily ingest new datasets. Hence, it can provide valuable, up-to-date insights to citizens, patients and policy-makers. We have made our code open source, and with the availability of open data, other researchers can easily reproduce and extend our work. This will help promote a deeper understanding of healthcare policies and public health issues.
arxiv情報
著者 | A. Ravishankar Rao,Subrata Garai,Soumyabrata Dey,Hang Peng |
発行日 | 2023-04-05 03:45:39+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI