Indoor Air Quality Dataset with Activities of Daily Living in Low to Middle-income Communities

要約

近年、屋内大気汚染は私たちの社会に重大な脅威を与えており、年間 320 万人以上の命が奪われています。
インドなどの発展途上国は、知識の欠如、不適切な規制、屋外の大気汚染により毎日深刻な汚染物質にさらされているため、最も影響を受けています。
しかし、屋内大気汚染がインドのような発展途上国にどのような影響を与えるかを理解しようと試みた研究は限られている。
このギャップに対処するために、夏期と冬期の 6 か月にわたる 30 の屋内サイトからの空気の質の時空間測定結果を示します。
これらのサイトは地理的に農村部、郊外、都市部の 4 つの地域にまたがって位置しており、インドの典型的な低所得者から中所得者層をカバーしています。
このデータセットには、さまざまなタイプの屋内環境 (ワンルーム アパート、教室、研究室、食堂、住宅など) が含まれており、発展途上国特有の汚染パターンに対処することを目的としたデータ駆動型の学習モデル研究の基礎を提供できます。
このユニークなデータセットには、データ収集中の停電やネットワーク停止による欠落データを処理するための高度なデータ クリーニングおよび代入技術が必要です。
さらに、単純な音声テキスト変換アプリケーションを通じて、居住者によって注釈が付けられたリアルタイムの屋内アクティビティ ラベルを提供します。
したがって、環境活動家や機械学習愛好家は、このデータセットを利用して、さまざまな屋内活動における汚染物質の複雑なパターンを理解し、繰り返し発生する汚染源を特定し、暴露を予測し、最新の屋内設計の間取りや部屋の構造を改善し、汚染を意識した推奨システムを開発することができます。

要約(オリジナル)

In recent years, indoor air pollution has posed a significant threat to our society, claiming over 3.2 million lives annually. Developing nations, such as India, are most affected since lack of knowledge, inadequate regulation, and outdoor air pollution lead to severe daily exposure to pollutants. However, only a limited number of studies have attempted to understand how indoor air pollution affects developing countries like India. To address this gap, we present spatiotemporal measurements of air quality from 30 indoor sites over six months during summer and winter seasons. The sites are geographically located across four regions of type: rural, suburban, and urban, covering the typical low to middle-income population in India. The dataset contains various types of indoor environments (e.g., studio apartments, classrooms, research laboratories, food canteens, and residential households), and can provide the basis for data-driven learning model research aimed at coping with unique pollution patterns in developing countries. This unique dataset demands advanced data cleaning and imputation techniques for handling missing data due to power failure or network outages during data collection. Furthermore, through a simple speech-to-text application, we provide real-time indoor activity labels annotated by occupants. Therefore, environmentalists and ML enthusiasts can utilize this dataset to understand the complex patterns of the pollutants under different indoor activities, identify recurring sources of pollution, forecast exposure, improve floor plans and room structures of modern indoor designs, develop pollution-aware recommender systems, etc.

arxiv情報

著者 Prasenjit Karmakar,Swadhin Pradhan,Sandip Chakraborty
発行日 2024-07-19 17:53:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク