EmTract: Extracting Emotions from Social Media


私たちは、経済的コンテキストに合わせてソーシャル メディアのテキストから感情を抽出するオープンソース ツール (EmTract) を開発しています。
そのために、金融ソーシャル メディア プラットフォーム (StockTwits) からの 1 万の短いメッセージに注釈を付け、それをオープンソースの感情データと組み合わせます。
次に、事前に調整された NLP モデルである DistilBERT を使用し、4,861 個のトークン (絵文字と顔文字) を含めることで埋め込みスペースを拡張し、まずそれをオープンソースの感情データに適合させ、次にそれを注釈付きの金融ソーシャル メディア データに転送します。
私たちのモデルは、人間と chatGPT の注釈付きデータの両方で、Emotion English DistilRoBERTa ベースなど、競合するオープンソースの最先端の感情分類器よりも優れたパフォーマンスを発揮します。
辞書ベースの方法と比較して、私たちの方法論には金融の研究において 3 つの主な利点があります。
まず、私たちのモデルは金融ソーシャル メディアのテキストに合わせて調整されています。
2 番目に、非標準のフレーズ、絵文字、顔文字などのソーシャル メディア データの重要な側面が組み込まれています。
3 番目に、語順、語の使用法、ローカル コンテキストなどの特徴を含む潜在表現を順次学習することによって動作します。
EmTract を使用して、ソーシャル メディアで表現される投資家の感情と資産価格の関係を調査します。


We develop an open-source tool (EmTract) that extracts emotions from social media text tailed for financial context. To do so, we annotate ten thousand short messages from a financial social media platform (StockTwits) and combine it with open-source emotion data. We then use a pre-tuned NLP model, DistilBERT, augment its embedding space by including 4,861 tokens (emojis and emoticons), and then fit it first on the open-source emotion data, then transfer it to our annotated financial social media data. Our model outperforms competing open-source state-of-the-art emotion classifiers, such as Emotion English DistilRoBERTa-base on both human and chatGPT annotated data. Compared to dictionary based methods, our methodology has three main advantages for research in finance. First, our model is tailored to financial social media text; second, it incorporates key aspects of social media data, such as non-standard phrases, emojis, and emoticons; and third, it operates by sequentially learning a latent representation that includes features such as word order, word usage, and local context. Using EmTract, we explore the relationship between investor emotions expressed on social media and asset prices. We show that firm-specific investor emotions are predictive of daily price movements. Our findings show that emotions and market dynamics are closely related, and we provide a tool to help study the role emotions play in financial markets.


著者 Domonkos F. Vamossy,Rolf Skog
発行日 2023-06-21 22:48:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, q-fin.PR パーマリンク