A Case Study and Qualitative Analysis of Simple Cross-Lingual Opinion Mining


ソーシャル メディアからユーザーが作成したコンテンツは多くの言語で作成されているため、1 つの領域で議論されているテーマを異なる文化や地域間で比較することは技術的に困難です。
これは、2 つの国や市場の人々が製品に対して異なる要件を持っている可能性がある市場調査など、グローバル化した世界の分野に関連します。
私たちは、自然言語理解のための事前トレーニング済みの最先端のディープ ニューラル ネットワークに基づいて、複数の言語を同時にカバーできるセンチメント分析を備えた単一トピック モデルを構築するための、シンプルでモダンで効果的な方法を提案します。
さらに、高い割合で安定したドメイン関連トピック、トピックとそれぞれのテキスト内容の間の意味のある関係、およびソーシャル メディア ドキュメントの解釈可能な表現が得られます。


User-generated content from social media is produced in many languages, making it technically challenging to compare the discussed themes from one domain across different cultures and regions. It is relevant for domains in a globalized world, such as market research, where people from two nations and markets might have different requirements for a product. We propose a simple, modern, and effective method for building a single topic model with sentiment analysis capable of covering multiple languages simultanteously, based on a pre-trained state-of-the-art deep neural network for natural language understanding. To demonstrate its feasibility, we apply the model to newspaper articles and user comments of a specific domain, i.e., organic food products and related consumption behavior. The themes match across languages. Additionally, we obtain an high proportion of stable and domain-relevant topics, a meaningful relation between topics and their respective textual contents, and an interpretable representation for social media documents. Marketing can potentially benefit from our method, since it provides an easy-to-use means of addressing specific customer interests from different market regions around the globe. For reproducibility, we provide the code, data, and results of our study.


著者 Gerhard Johann Hagerer,Wing Sheung Leung,Qiaoxi Liu,Hannah Danner,Georg Groh
発行日 2023-07-24 20:03:14+00:00
