PANCETTA: Phoneme Aware Neural Completion to Elicit Tongue Twisters Automatically

要約

早口言葉は、発音しにくい意味のある文です。
早口言葉を自動的に生成するプロセスは、生成された発話が音声上の難しさと意味的意味という 2 つの条件を同時に満たす必要があるため、困難です。
さらに、発音の難しさ自体を特徴付けるのは難しく、頭韻や同音異義語などの現象の異種混合を通じて自然な早口言葉で表現されます。
この論文では、PANCETTA: Tongue Twisters を自動的に誘発する音素認識ニューラル補完を提案します。
音素表現を活用して音声の難しさの概念を捉え、言語モデルをトレーニングして、2 つの提案されたタスク設定でオリジナルの早口言葉を生成します。
これを行うために、既存の英語の早口言葉で構成される PANCETTA と呼ばれるデータセットをキュレートします。
自動評価と人間による評価、および定性的分析を通じて、PANCETTA が斬新で、音声的に難しく、流暢で、意味的に意味のある早口言葉を生成することを示します。

要約(オリジナル)

Tongue twisters are meaningful sentences that are difficult to pronounce. The process of automatically generating tongue twisters is challenging since the generated utterance must satisfy two conditions at once: phonetic difficulty and semantic meaning. Furthermore, phonetic difficulty is itself hard to characterize and is expressed in natural tongue twisters through a heterogeneous mix of phenomena such as alliteration and homophony. In this paper, we propose PANCETTA: Phoneme Aware Neural Completion to Elicit Tongue Twisters Automatically. We leverage phoneme representations to capture the notion of phonetic difficulty, and we train language models to generate original tongue twisters on two proposed task settings. To do this, we curate a dataset called PANCETTA, consisting of existing English tongue twisters. Through automatic and human evaluation, as well as qualitative analysis, we show that PANCETTA generates novel, phonetically difficult, fluent, and semantically meaningful tongue twisters.

arxiv情報

著者 Sedrick Scott Keh,Steven Y. Feng,Varun Gangal,Malihe Alikhani,Eduard Hovy
発行日 2023-02-15 04:17:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク