Big Data and Large Numbers. Interpreting Zipf’s Law

要約

【タイトル】
ビッグデータと大規模な数。ジップの法則の解釈

【要約】
– ビッグデータにおいて、いくつかの経験的事実は大量の数字の特性の影響を受けることがわかっている。
– ジップの法則のノイズはそのようなアーティファクトの一例である。
– ポピュレーションが有限であり、ポピュレーション内の要素のランクと数が自然数である場合に生じる冪律分布や類似した分布のいくつかの特性を明らかにする。
– ジップの法則の解釈における影響について議論される。

要約(オリジナル)

It turns out that some empirical facts in Big Data are the effects of properties of large numbers. Zipf’s law noise is an example of such an artefact. We expose several properties of the power law distributions and of similar distribution that occur when the population is finite and the rank and counts of elements in the population are natural numbers. Consequences in the interpretation of Zipf’s law are discussed.

arxiv情報

著者 Horia-Nicolai L. Teodorescu
発行日 2023-05-04 10:03:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: 11, 62, cs.CL, G.3, math.ST, physics.soc-ph, stat.TH パーマリンク