Multi-Target Tobit Models for Completing Water Quality Data

要約

水中の微生物学的挙動を監視することは、水に浮遊する病原体による公衆衛生上のリスクを管理するために重要ですが、水中の微生物の濃度を定量化することは依然として困難です。なぜなら、水中サンプル中の多くの病原体の濃度は、多くの場合、定量限界を下回り、検閲データを生成する可能性があるためです。
定量的な値に基づく統計分析を可能にするためには、検出されない測定値の真の値を高い精度で推定する必要があります。
Tobit モデルは、打ち切りデータを分析するためのよく知られた線形回帰モデルです。
Tobit モデルの欠点の 1 つは、ターゲット変数のみが打ち切られることです。
この研究では、\emph{マルチターゲット トービット モデル} と呼ばれる古典的なトービット モデルの新しい拡張を考案し、複数のターゲット変数を導入することで、複数の打ち切り変数を同時に処理しました。
新しいモデルを適合させるために、精巧な理論に基づいて数値安定最適化アルゴリズムが開発されました。
いくつかの実世界の水質データセットを使用して実施された実験では、複数の列をまとめて推定すると、それらを個別に推定するよりも大きな利点が得られるという証拠が得られました。

要約(オリジナル)

Monitoring microbiological behaviors in water is crucial to manage public health risk from waterborne pathogens, although quantifying the concentrations of microbiological organisms in water is still challenging because concentrations of many pathogens in water samples may often be below the quantification limit, producing censoring data. To enable statistical analysis based on quantitative values, the true values of non-detected measurements are required to be estimated with high precision. Tobit model is a well-known linear regression model for analyzing censored data. One drawback of the Tobit model is that only the target variable is allowed to be censored. In this study, we devised a novel extension of the classical Tobit model, called the \emph{multi-target Tobit model}, to handle multiple censored variables simultaneously by introducing multiple target variables. For fitting the new model, a numerical stable optimization algorithm was developed based on elaborate theories. Experiments conducted using several real-world water quality datasets provided an evidence that estimating multiple columns jointly gains a great advantage over estimating them separately.

arxiv情報

著者 Yuya Takada,Tsuyoshi Kato
発行日 2023-02-21 13:06:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク