要約
この研究の主な目的は、機械学習手法を使用してライブラリの比較比較を提供することです。
自然言語処理 (NLP) の専門家は、テキスト変更のセンチメント分析 (SA) にますます関心を持っています。
NLP テキスト分析技術を採用する目的は、twitter ユーザーの発話に関連する感情を認識し、分類することです。
この検討では、SA と利用されるライブラリの問題も検討されます。
は、感情の極性を分類するための協力的な方法を多数提供します。
最近の研究によれば、Naive Bayes Classifier、Decision Tree Classifier、Maxent Classifier、Sklearn Classifier、Sklearn Classifier MultinomialNB、およびその他の結合学習アルゴリズムは非常に効果的です。
このプロジェクトでは、NLTK、TextBlob、Vader、Transformers (GPT および BERT 事前トレーニング済み) という 5 つの Python および R ライブラリが使用され、感情分析手法を適用する研究では Tidytext が使用されます。
4 つの機械学習モデル、Tree of Decisions (DT)、Support Vector Machine (SVM)、Naive Bayes (NB)、および K-Nearest Neighbor (KNN) も使用されます。
SA 用ライブラリがソーシャル ネットワーク環境でどの程度うまく機能するかを評価するために、比較研究も実施されました。
この実験で最良のアルゴリズムを評価するための尺度は、精度、再現率、および F1 スコアであり、各手法に単一のデータセットを使用しました。
センチメント分析には、精度: 0.973 の BERT 変換メソッドが推奨されると結論付けられます。
要約(オリジナル)
This study is main goal is to provide a comparative comparison of libraries using machine learning methods. Experts in natural language processing (NLP) are becoming more and more interested in sentiment analysis (SA) of text changes. The objective of employing NLP text analysis techniques is to recognize and categorize feelings related to twitter users utterances. In this examination, issues with SA and the libraries utilized are also looked at. provides a number of cooperative methods to classify emotional polarity. The Naive Bayes Classifier, Decision Tree Classifier, Maxent Classifier, Sklearn Classifier, Sklearn Classifier MultinomialNB, and other conjoint learning algorithms, according to recent research, are very effective. In the project will use Five Python and R libraries NLTK, TextBlob, Vader, Transformers (GPT and BERT pretrained), and Tidytext will be used in the study to apply sentiment analysis techniques. Four machine learning models Tree of Decisions (DT), Support Vector Machine (SVM), Naive Bayes (NB), and K-Nearest Neighbor (KNN) will also be used. To evaluate how well libraries for SA operate in the social network environment, comparative study was also carried out. The measures to assess the best algorithms in this experiment, which used a single data set for each method, were precision, recall, and F1 score. We conclude that the BERT transformer method with an Accuracy: 0.973 is recommended for sentiment analysis.
arxiv情報
著者 | Wendy Ccoya,Edson Pinto |
発行日 | 2023-07-26 17:21:53+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google