Use of social media and Natural Language Processing (NLP) in natural hazard research

要約

タイトル: 自然災害研究におけるソーシャルメディアと自然言語処理(NLP)の利用
要約:

– ソーシャルメディアの1つであるTwitterは、短い公開テキストメッセージ(ツイート)を送信するマイクロブログサービスである。
– Sasakiら(2010)とEarleら(2011)の研究では、Twitter上でのリアルタイムな相互作用を調査し、ユーザーのツイートに基づいて自然災害(地震、台風など)を検出することが試みられた。
– そのようなアプリケーションにおける本質的な課題は、自然言語処理(NLP)であり、基本的には単語を数値(ベクトルやテンソル)に変換して、予測や分類を行うことである。
– 最近では、テキストをコンピュータで処理するための高度な計算ツールが利用可能になっている。
– この報告書では、機械学習によるNLPを実装し、テキストだけで構成されるファイルに基づいてイベントを処理および分類するために、機械学習アプリケーションのためのエンドツーエンドのオープンソースプラットフォームであるTensorFlowを使用する。

要約(オリジナル)

Twitter is a microblogging service for sending short, public text messages (tweets) that has recently received more attention in scientific comunity. In the works of Sasaki et al. (2010) and Earle et al., (2011) the authors explored the real-time interaction on Twitter for detecting natural hazards (e.g., earthquakes, typhoons) baed on users’ tweets. An inherent challenge for such an application is the natural language processing (NLP), which basically consists in converting the words in number (vectors and tensors) in order to (mathematically/ computationally) make predictions and classifications. Recently advanced computational tools have been made available for dealing with text computationally. In this report we implement a NLP machine learning with TensorFlow, an end-to-end open source plataform for machine learning applications, to process and classify evenct based on files containing only text.

arxiv情報

著者 José Augusto Proença Maia Devienne
発行日 2023-04-17 15:03:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL, physics.geo-ph パーマリンク