Deep learning model for Mongolian Citizens Feedback Analysis using Word Vector Embeddings

要約

何年にもわたって大量のフィードバックが集められました。
英語に焦点を当てた多くのフィードバック分析モデルが開発されています。
フィードバックの概念を認識することは、自然言語処理で使用される適切なコーパスとツール (つまり、語彙コーパス、文構造規則など) を持たない言語では困難であり、非常に重要です。
ただし、この論文では、深層学習のために2つの異なる単語埋め込みを使用して、モンゴル語の​​フィードバック分類を研究します。
提案されたアプローチの結果を比較します。
2012 年から 2018 年に収集されたキリル文字のフィードバック データを使用します。
結果は、独自のデータセットを使用した単語埋め込みが、2 つの分類タスクで 80.1% と 82.7% の最高精度で、ディープ ラーニング ベースの提案されたモデルを改善することを示しています。

要約(オリジナル)

A large amount of feedback was collected over the years. Many feedback analysis models have been developed focusing on the English language. Recognizing the concept of feedback is challenging and crucial in languages which do not have applicable corpus and tools employed in Natural Language Processing (i.e., vocabulary corpus, sentence structure rules, etc). However, in this paper, we study a feedback classification in Mongolian language using two different word embeddings for deep learning. We compare the results of proposed approaches. We use feedback data in Cyrillic collected from 2012-2018. The result indicates that word embeddings using their own dataset improve the deep learning based proposed model with the best accuracy of 80.1% and 82.7% for two classification tasks.

arxiv情報

著者 Zolzaya Dashdorj,Tsetsentsengel Munkhbayar,Stanislav Grigorev
発行日 2023-02-23 14:49:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク