Exploring the law of text geographic information

要約

テキスト化された地理情報は、実用的なアプリケーションにおいて不可欠であり、大いに活用されている。しかし、明確な分布が存在しないため、地理情報を効果的に活用することが困難である。我々は、地理情報は人間の行動、認知、表現、思考プロセスの影響を受けると主張し、自然システムの直感的な理解から、ガンマ分布への適合を仮定する。様々な言語や種類を含む24のデータセットに対する厳密な実験を通して、我々はこの仮説を実証し、地理情報の量、長さ、距離の次元を支配する根本的な規則性を明らかにした。さらに、理論的な分析とガウス分布やZipfの法則との比較により、これらの法則の偶発性を否定した。さらに、人間の地理情報活用の上限を推定し、未知の領域の存在を指摘した。また、地理情報抽出のガイダンスも提供する。地理情報のベールに包まれた真の姿を明らかにすることを願っている。

要約(オリジナル)

Textual geographic information is indispensable and heavily relied upon in practical applications. The absence of clear distribution poses challenges in effectively harnessing geographic information, thereby driving our quest for exploration. We contend that geographic information is influenced by human behavior, cognition, expression, and thought processes, and given our intuitive understanding of natural systems, we hypothesize its conformity to the Gamma distribution. Through rigorous experiments on a diverse range of 24 datasets encompassing different languages and types, we have substantiated this hypothesis, unearthing the underlying regularities governing the dimensions of quantity, length, and distance in geographic information. Furthermore, theoretical analyses and comparisons with Gaussian distributions and Zipf’s law have refuted the contingency of these laws. Significantly, we have estimated the upper bounds of human utilization of geographic information, pointing towards the existence of uncharted territories. Also, we provide guidance in geographic information extraction. Hope we peer its true countenance uncovering the veil of geographic information.

arxiv情報

著者 Zhenhua Wang,Daiyu Zhang,Ming Ren,Guang Xu
発行日 2023-09-01 00:14:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL パーマリンク