Do learned speech symbols follow Zipf’s law?

要約

この研究では、深層学習を通じて学習された音声記号が、自然言語記号に似たジップの法則に従うかどうかを調査します。
ジップの法則は、単語の頻度分布を説明する経験則であり、自然言語処理における統計分析の基礎を形成します。
音声の内容を象徴するために人間が発明した自然言語記号は、この法則に準拠していると認められています。
その一方で、音声言語処理における最近の進歩により、学習された音声記号の開発がもたらされました。
これらは、音声コンテンツのデータ駆動型の記号化です。
私たちの目的は、これらのデータ駆動型音声記号が自然言語記号と同様に Zipf の法則に従っているかどうかを確認することです。
私たちは調査を通じて、音声言語処理の統計分析のための新しい方法を確立することを目指しています。

要約(オリジナル)

In this study, we investigate whether speech symbols, learned through deep learning, follow Zipf’s law, akin to natural language symbols. Zipf’s law is an empirical law that delineates the frequency distribution of words, forming fundamentals for statistical analysis in natural language processing. Natural language symbols, which are invented by humans to symbolize speech content, are recognized to comply with this law. On the other hand, recent breakthroughs in spoken language processing have given rise to the development of learned speech symbols; these are data-driven symbolizations of speech content. Our objective is to ascertain whether these data-driven speech symbols follow Zipf’s law, as the same as natural language symbols. Through our investigation, we aim to forge new ways for the statistical analysis of spoken language processing.

arxiv情報

著者 Shinnosuke Takamichi,Hiroki Maeda,Joonyong Park,Daisuke Saito,Hiroshi Saruwatari
発行日 2023-09-18 11:56:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.SD, eess.AS パーマリンク