Unmasking Falsehoods in Reviews: An Exploration of NLP Techniques

要約

現代のデジタル環境において、オンライン レビューはさまざまなビジネス全体で製品やサービスを宣伝するために不可欠なツールとなっています。
マーケティング担当者、広告主、およびオンライン企業は、自社の製品については人を欺く肯定的なレビューを作成し、競合他社の製品については否定的なレビューを作成する動機を見つけています。
その結果、自社を宣伝したり、ライバルを弱体化させようとする企業にとって、欺瞞的なレビューを書くことは避けられない行為となった。
このような欺瞞的なレビューを検出することは、現在も継続的に行われている集中的な研究分野となっています。
この研究論文では、特にレストランに焦点を当てて、虚偽のレビューを特定するための機械学習モデルを提案しています。
この研究では、Deceptive Opinion Spam Corpus として知られるレストランのレビューのデータセットに対して行われた多数の実験のパフォーマンスを詳しく調査しています。
これを達成するために、特に偽のレビューに焦点を当てて、欺瞞的なコンテンツを効果的に特定するための n-gram モデルと max 特徴が開発されました。
2 つの異なる特徴抽出手法のパフォーマンスを調査するためにベンチマーク調査が行われ、それらの手法が 5 つの異なる機械学習分類アルゴリズムと組み合わせられます。
実験結果から、パッシブアグレッシブ分類器がさまざまなアルゴリズムの中で際立っており、テキスト分類だけでなく偽レビューの特定においても最高の精度を示していることが明らかになりました。
さらに、この研究ではデータの増強を掘り下げ、さまざまな深層学習技術を実装して、欺瞞的なレビューを検出するプロセスをさらに強化しています。
この調査結果は、提案されている機械学習アプローチの有効性を明らかにし、オンライン ビジネスの分野における欺瞞的なレビューへの対処に関する貴重な洞察を提供します。

要約(オリジナル)

In the contemporary digital landscape, online reviews have become an indispensable tool for promoting products and services across various businesses. Marketers, advertisers, and online businesses have found incentives to create deceptive positive reviews for their products and negative reviews for their competitors’ offerings. As a result, the writing of deceptive reviews has become an unavoidable practice for businesses seeking to promote themselves or undermine their rivals. Detecting such deceptive reviews has become an intense and ongoing area of research. This research paper proposes a machine learning model to identify deceptive reviews, with a particular focus on restaurants. This study delves into the performance of numerous experiments conducted on a dataset of restaurant reviews known as the Deceptive Opinion Spam Corpus. To accomplish this, an n-gram model and max features are developed to effectively identify deceptive content, particularly focusing on fake reviews. A benchmark study is undertaken to explore the performance of two different feature extraction techniques, which are then coupled with five distinct machine learning classification algorithms. The experimental results reveal that the passive aggressive classifier stands out among the various algorithms, showcasing the highest accuracy not only in text classification but also in identifying fake reviews. Moreover, the research delves into data augmentation and implements various deep learning techniques to further enhance the process of detecting deceptive reviews. The findings shed light on the efficacy of the proposed machine learning approach and offer valuable insights into dealing with deceptive reviews in the realm of online businesses.

arxiv情報

著者 Anusuya Baby Hari Krishnan
発行日 2023-07-21 09:49:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.IR, cs.LG, I.2.7 パーマリンク