MEDIC: A Multi-Task Learning Dataset for Disaster Image Classification

要約

災害情報学の最近の研究では、ソーシャルメディアのコンテンツ(テキストと画像)に基づき、自然災害時の人命と苦痛を救うための人工知能の実用的かつ重要な使用事例が示されています。テキストを用いた研究は顕著に進展しているが、画像を活用する研究は比較的未開拓のままである。画像ベースのアプローチを進めるために、我々はMEDIC (Available at: https://crisisnlp.qcri.org/medic/index.html)を提案します。これは、マルチタスク学習セットアップで4つの異なるタスクに取り組む71,198枚の画像からなる、人道的対応に関する最大のソーシャルメディア画像分類のデータセットです。これは、ソーシャルメディア画像、災害対応、マルチタスク学習研究という、この種のデータセットとしては初めてのものです。本データセットの重要な特性は、近年機械学習界で注目され、記憶、推論速度、性能、汎化能力などの面で目覚ましい成果を上げているマルチタスク学習の研究を促進する高い可能性を持っていることである。したがって、提案するデータセットは、画像ベースの災害管理およびマルチタスク機械学習研究を進めるための重要なリソースとなる。我々は、異なる深層学習アーキテクチャで実験し、すべてのタスクで大多数のベースラインを上回る有望な結果を報告する。データセットとともに、関連するすべてのスクリプトも公開します(https://github.com/firojalam/medic)。

要約(オリジナル)

Recent research in disaster informatics demonstrates a practical and important use case of artificial intelligence to save human lives and suffering during natural disasters based on social media contents (text and images). While notable progress has been made using texts, research on exploiting the images remains relatively under-explored. To advance image-based approaches, we propose MEDIC (Available at: https://crisisnlp.qcri.org/medic/index.html), which is the largest social media image classification dataset for humanitarian response consisting of 71,198 images to address four different tasks in a multi-task learning setup. This is the first dataset of its kind: social media images, disaster response, and multi-task learning research. An important property of this dataset is its high potential to facilitate research on multi-task learning, which recently receives much interest from the machine learning community and has shown remarkable results in terms of memory, inference speed, performance, and generalization capability. Therefore, the proposed dataset is an important resource for advancing image-based disaster management and multi-task machine learning research. We experiment with different deep learning architectures and report promising results, which are above the majority baselines for all tasks. Along with the dataset, we also release all relevant scripts (https://github.com/firojalam/medic).

arxiv情報

著者 Firoj Alam,Tanvirul Alam,Md. Arid Hasan,Abul Hasnat,Muhammad Imran,Ferda Ofli
発行日 2022-06-08 19:39:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: 68T50, cs.CV, cs.CY, cs.LG, cs.SI, I.2.7 パーマリンク