Exploring a new machine learning based probabilistic model for high-resolution indoor radon mapping, using the German indoor radon survey data

要約

ラドンは発がん性のある放射性ガスであり、屋内に蓄積する可能性がある。したがって、屋内ラドン濃度の正確な知識は、ラドンに関連する健康への影響を評価したり、ラドンが発生しやすい地域を特定したりする上で極めて重要である。通常、全国規模の屋内ラドン濃度は、大規模な測定キャンペーンに基づいて推定される。しかし、地質ラドンの有無や床面の高さなど、室内ラドン濃度を支配する多くの関連要因のために、サンプルの特徴はしばしば住民の特徴とは異なる。さらに、サンプルサイズは通常、高い空間分解能での推定を可能にしない。われわれは、純粋にデータに基づくアプローチよりも高い空間分解能で室内ラドン分布をより現実的に推定できるモデルに基づくアプローチを提案する。1)環境データと建物データを予測因子とする分位数回帰フォレストを適用して、ドイツの各住宅建物の各階層における屋内ラドンの確率分布関数を推定した;(2)確率論的モンテカルロ・サンプリング法により、各階層の予測値の組み合わせと母集団の重み付けを可能にした。このようにして、個々の予測値の不確実性が、集約されたレベルでの変動の推定値に効果的に伝播される。結果は、算術平均63 Bq/m3、幾何平均41 Bq/m3、95%マイル180 Bq/m3のほぼ対数正規分布を示した。100 Bq/m3と300 Bq/m3の超過確率は、それぞれ12.5 %(1,050万人)と2.2 %(190万人)である。

要約(オリジナル)

Radon is a carcinogenic, radioactive gas that can accumulate indoors. Therefore, accurate knowledge of indoor radon concentration is crucial for assessing radon-related health effects or identifying radon-prone areas. Indoor radon concentration at the national scale is usually estimated on the basis of extensive measurement campaigns. However, characteristics of the sample often differ from the characteristics of the population due to the large number of relevant factors that control the indoor radon concentration such as the availability of geogenic radon or floor level. Furthermore, the sample size usually does not allow estimation with high spatial resolution. We propose a model-based approach that allows a more realistic estimation of indoor radon distribution with a higher spatial resolution than a purely data-based approach. A two-stage modelling approach was applied: 1) a quantile regression forest using environmental and building data as predictors was applied to estimate the probability distribution function of indoor radon for each floor level of each residential building in Germany; (2) a probabilistic Monte Carlo sampling technique enabled the combination and population weighting of floor-level predictions. In this way, the uncertainty of the individual predictions is effectively propagated into the estimate of variability at the aggregated level. The results show an approximate lognormal distribution with an arithmetic mean of 63 Bq/m3, a geometric mean of 41 Bq/m3 and a 95 %ile of 180 Bq/m3. The exceedance probability for 100 Bq/m3 and 300 Bq/m3 are 12.5 % (10.5 million people) and 2.2 % (1.9 million people), respectively.

arxiv情報

著者 Eric Petermann,Peter Bossew,Joachim Kemski,Valeria Gruber,Nils Suhr,Bernd Hoffmann
発行日 2024-03-01 07:39:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, physics.data-an, stat.ML パーマリンク