Mordecai 3: A Neural Geoparser and Event Geocoder

要約

Mordecai3 は、新しいエンド ツー エンドのテキスト ジオパーサーおよびイベント ジオロケーション システムです。
このシステムは、新しいニューラル ランキング モデルを使用して地名解決を実行し、ドキュメントから抽出された地名を Geonames Gazetteer のエントリに解決します。
また、既製の質問応答モデルを使用して、テキストで報告されたイベントと、発生が報告された場所の名前を関連付けるプロセスであるイベント ジオコーディングも実行します。
地名解決モデルは、既存のトレーニング データの多様なセットと、新たに注釈が付けられた数千の例でトレーニングされます。
このホワイト ペーパーでは、モデル、そのトレーニング プロセス、および既存のジオパーサーとのパフォーマンスの比較について説明します。
このシステムは、オープン ソースの Python ライブラリである Mordecai 3 として利用でき、最も広く使用されているテキスト ジオパーサーの 1 つである以前のジオパーサーである Mordecai v2 に取って代わります (Halterman 2017)。

要約(オリジナル)

Mordecai3 is a new end-to-end text geoparser and event geolocation system. The system performs toponym resolution using a new neural ranking model to resolve a place name extracted from a document to its entry in the Geonames gazetteer. It also performs event geocoding, the process of linking events reported in text with the place names where they are reported to occur, using an off-the-shelf question-answering model. The toponym resolution model is trained on a diverse set of existing training data, along with several thousand newly annotated examples. The paper describes the model, its training process, and performance comparisons with existing geoparsers. The system is available as an open source Python library, Mordecai 3, and replaces an earlier geoparser, Mordecai v2, one of the most widely used text geoparsers (Halterman 2017).

arxiv情報

著者 Andrew Halterman
発行日 2023-03-23 21:10:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク