A Case Study and Qualitative Analysis of Simple Cross-Lingual Opinion Mining

要約

ソーシャル メディアからユーザーが作成したコンテンツは多くの言語で作成されているため、1 つの領域で議論されているテーマを異なる文化や地域間で比較することは技術的に困難です。
これは、2 つの国や市場の人々が製品に対して異なる要件を持っている可能性がある市場調査など、グローバル化した世界の分野に関連します。
私たちは、自然言語理解のための事前トレーニング済みの最先端のディープ ニューラル ネットワークに基づいて、複数の言語を同時にカバーできるセンチメント分析を備えた単一トピック モデルを構築するための、シンプルでモダンで効果的な方法を提案します。
その実現可能性を実証するために、このモデルを特定の分野、つまりオーガニック食品と関連する消費行動の新聞記事とユーザーのコメントに適用します。
テーマは言語を問わず一致します。
さらに、高い割合で安定したドメイン関連トピック、トピックとそれぞれのテキスト内容の間の意味のある関係、およびソーシャル メディア ドキュメントの解釈可能な表現が得られます。
当社の手法は、世界中のさまざまな市場地域の特定の顧客の関心に対処する使いやすい手段を提供するため、マーケティングは潜在的に恩恵を受けることができます。
再現性を高めるために、コード、データ、研究結果を提供します。

要約(オリジナル)

User-generated content from social media is produced in many languages, making it technically challenging to compare the discussed themes from one domain across different cultures and regions. It is relevant for domains in a globalized world, such as market research, where people from two nations and markets might have different requirements for a product. We propose a simple, modern, and effective method for building a single topic model with sentiment analysis capable of covering multiple languages simultanteously, based on a pre-trained state-of-the-art deep neural network for natural language understanding. To demonstrate its feasibility, we apply the model to newspaper articles and user comments of a specific domain, i.e., organic food products and related consumption behavior. The themes match across languages. Additionally, we obtain an high proportion of stable and domain-relevant topics, a meaningful relation between topics and their respective textual contents, and an interpretable representation for social media documents. Marketing can potentially benefit from our method, since it provides an easy-to-use means of addressing specific customer interests from different market regions around the globe. For reproducibility, we provide the code, data, and results of our study.

arxiv情報

著者 Gerhard Johann Hagerer,Wing Sheung Leung,Qiaoxi Liu,Hannah Danner,Georg Groh
発行日 2023-07-24 20:03:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.IR パーマリンク