要約
この研究では、深層学習を通じて学習された音声記号が、自然言語記号に似たジップの法則に従うかどうかを調査します。
ジップの法則は、単語の頻度分布を説明する経験則であり、自然言語処理における統計分析の基礎を形成します。
音声の内容を象徴するために人間が発明した自然言語記号は、この法則に準拠していると認められています。
その一方で、音声言語処理における最近の進歩により、学習された音声記号の開発がもたらされました。
これらは、音声コンテンツのデータ駆動型の記号化です。
私たちの目的は、これらのデータ駆動型音声記号が自然言語記号と同様に Zipf の法則に従っているかどうかを確認することです。
私たちは調査を通じて、音声言語処理の統計分析のための新しい方法を確立することを目指しています。
要約(オリジナル)
In this study, we investigate whether speech symbols, learned through deep learning, follow Zipf’s law, akin to natural language symbols. Zipf’s law is an empirical law that delineates the frequency distribution of words, forming fundamentals for statistical analysis in natural language processing. Natural language symbols, which are invented by humans to symbolize speech content, are recognized to comply with this law. On the other hand, recent breakthroughs in spoken language processing have given rise to the development of learned speech symbols; these are data-driven symbolizations of speech content. Our objective is to ascertain whether these data-driven speech symbols follow Zipf’s law, as the same as natural language symbols. Through our investigation, we aim to forge new ways for the statistical analysis of spoken language processing.
arxiv情報
| 著者 | Shinnosuke Takamichi,Hiroki Maeda,Joonyong Park,Daisuke Saito,Hiroshi Saruwatari | 
| 発行日 | 2023-09-18 11:56:10+00:00 | 
| arxivサイト | arxiv_id(pdf) | 
提供元, 利用サービス
arxiv.jp, Google
