Computationally Assisted Quality Control for Public Health Data Streams

要約

公衆衛生データ ストリームの不規則性 (新型コロナウイルス感染症の感染者数など) は、公衆衛生関係者によるデータに基づく意思決定を妨げています。
毎日更新される何千もの公衆衛生データ ストリームからの、最も重要な外れデータ​​ ポイントのコンピュータ生成のリアルタイム リストは、専門家レビューアがこれらの不正を特定するのに役立ちます。
ただし、既存の外れ値検出フレームワークは、データ量や公衆衛生の流れの統計的特性を考慮していないため、このタスクではあまり機能しません。
そこで、私たちは、シンプルでスケーラブルなモデルを使用してこれらの統計的特性を明示的に取得する、公衆衛生データ ユーザー向けの実用的な外れ値検出フレームワークである FlaSH (Flagging Streams in public Health) を開発しました。
人間の専門家が FlaSH と既存の手法 (深層学習アプローチを含む) を評価する実験では、FlaSH はこのタスクのデータ量に合わせてスケールし、平均精度でこれらの他の手法と同等またはそれを上回り、ユーザーが経験的により役立つと評価する外れ値ポイントを特定します。

これらの結果に基づいて、FlaSH は公衆衛生関係者が使用するデータ ストリームに導入されました。

要約(オリジナル)

Irregularities in public health data streams (like COVID-19 Cases) hamper data-driven decision-making for public health stakeholders. A real-time, computer-generated list of the most important, outlying data points from thousands of daily-updated public health data streams could assist an expert reviewer in identifying these irregularities. However, existing outlier detection frameworks perform poorly on this task because they do not account for the data volume or for the statistical properties of public health streams. Accordingly, we developed FlaSH (Flagging Streams in public Health), a practical outlier detection framework for public health data users that uses simple, scalable models to capture these statistical properties explicitly. In an experiment where human experts evaluate FlaSH and existing methods (including deep learning approaches), FlaSH scales to the data volume of this task, matches or exceeds these other methods in mean accuracy, and identifies the outlier points that users empirically rate as more helpful. Based on these results, FlaSH has been deployed on data streams used by public health stakeholders.

arxiv情報

著者 Ananya Joshi,Kathryn Mazaitis,Roni Rosenfeld,Bryan Wilder
発行日 2023-06-29 13:08:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク