CMDAG: A Chinese Metaphor Dataset with Annotated Grounds as CoT for Boosting Metaphor Generation

要約

比喩は、色、イメージ、強調を加えて効果的なコミュニケーションを強化するため、人間の言語や文学において顕著な言語装置です。
この論文では、詩、散文、歌の歌詞など、さまざまな中国文学ソースから抽出された約 28,000 の文で構成される、大規模で高品質の注釈付き中国語比喩コーパスを紹介します。 注釈の正確性と一貫性を確保するために、
包括的な一連のガイドラインを導入します。
これらのガイドラインは、テノール、媒体、および直喩、擬人化、並置、誇張の複雑さを処理するための根拠の特定を含む、メタファー アノテーションの側面に取り組んでいます。
伝統を打ち破り、メタファー生成に対する私たちのアプローチは、テナーとビークルの従来の組み合わせではなく、根拠とその独特の特徴を強調します。
CoT (思考連鎖) 入力として「地面」を統合することにより、現実世界の直観とより共鳴するメタファーを生成することができます。
注釈付きコーパスを使用して、Belle、Baichuan、chinese-alpaca-33B などの生成モデルをテストします。
これらのモデルは、データセットから選択されたサンプルによってより頻繁に誘発される創造的で流暢な比喩文を生成することができ、中国語の比喩研究におけるコーパスの価値を実証しています。
コードは https://anonymous.4open.science/r/ Chinese_Metaphor_payment-63F2 で入手できます。

要約(オリジナル)

Metaphor is a prominent linguistic device in human language and literature, as they add color, imagery, and emphasis to enhance effective communication. This paper introduces a large-scale high quality annotated Chinese Metaphor Corpus, which comprises around 28K sentences drawn from a diverse range of Chinese literary sources, such as poems, prose, song lyrics, etc. To ensure the accuracy and consistency of our annotations, we introduce a comprehensive set of guidelines. These guidelines address the facets of metaphor annotation, including identifying tenors, vehicles, and grounds to handling the complexities of similes, personifications, juxtapositions, and hyperboles. Breaking tradition, our approach to metaphor generation emphasizes grounds and their distinct features rather than the conventional combination of tenors and vehicles. By integrating ‘ground’ as a CoT (Chain of Thoughts) input, we are able to generate metaphors that resonate more with real-world intuition. We test generative models such as Belle, Baichuan, and Chinese-alpaca-33B using our annotated corpus. These models are able to generate creative and fluent metaphor sentences more frequently induced by selected samples from our dataset, demonstrating the value of our corpus for Chinese metaphor research. The code is available in the https://anonymous.4open.science/r/Chinese_Metaphor_Explanation-63F2.

arxiv情報

著者 Yujie Shao,Xinrong Yao,Xingwei Qu,Chenghua Lin,Shi Wang,Stephen W. Huang,Ge Zhang,Jie Fu
発行日 2024-02-20 17:00:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク