Disentangling Singlish Discourse Particles with Task-Driven Representation

要約

シングリッシュ、または正式には口語シンガポール英語は、東南アジアの国シンガポール発祥の英語ベースのクレオール言語です。
この言語には、中国の方言、マレー語、タミル語などの中国語の影響が含まれています。
シングリッシュを理解するための基本的な課題は、シングリッシュが意味を伝えるために大きく依存している談話の助詞の語用論的な機能をまず理解することです。
この研究は、シングリッシュの談話粒子 (まあ、まあ、ホル) をタスク駆動表現学習で解きほぐすための予備的な取り組みを提供します。
もつれを解いた後、これらの談話粒子をクラスタリングしてその語用的機能を区別し、英語から英語への機械翻訳を実行します。
私たちの研究は、シングリッシュの談話粒子を理解するための計算手法を提供し、シングリッシュ言語とその使用法をより深く理解するための道を開きます。

要約(オリジナル)

Singlish, or formally Colloquial Singapore English, is an English-based creole language originating from the SouthEast Asian country Singapore. The language contains influences from Sinitic languages such as Chinese dialects, Malay, Tamil and so forth. A fundamental task to understanding Singlish is to first understand the pragmatic functions of its discourse particles, upon which Singlish relies heavily to convey meaning. This work offers a preliminary effort to disentangle the Singlish discourse particles (lah, meh and hor) with task-driven representation learning. After disentanglement, we cluster these discourse particles to differentiate their pragmatic functions, and perform Singlish-to-English machine translation. Our work provides a computational method to understanding Singlish discourse particles, and opens avenues towards a deeper comprehension of the language and its usage.

arxiv情報

著者 Linus Tze En Foo,Lynnette Hui Xian Ng
発行日 2024-09-30 15:04:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク