要約
生成的AIの上昇は、AIに生成されたレビューの急増につながり、多くの場合、オンラインプラットフォームの信頼性に深刻な脅威をもたらします。
レビューは、製品とサービスに関する主要な情報源として機能します。
本物のレビューは、消費者の意思決定において重要な役割を果たします。
製造されたコンテンツの存在は、消費者を誤解させ、デジタル市場での潜在的な詐欺を信頼し、促進します。
この研究では、このドメインの研究が比較的経験していない2つの低リソース言語であるタミル語とマラヤーラム語でのAI生成された製品レビューの検出に焦点を当てています。
私たちは、従来の機械学習方法から、Indic-Bert、Indicsbert、Muril、XLM-Roberta、Malayalambertなどの高度な変圧器ベースのモデルまで、さまざまなアプローチに取り組みました。
私たちの調査結果は、AIが生成されたコンテンツを正確に識別する上で最先端の変圧器を活用することの有効性を強調し、低リソースの言語設定での偽のレビューの検出を強化する可能性を示しています。
要約(オリジナル)
The rise of Generative AI has led to a surge in AI-generated reviews, often posing a serious threat to the credibility of online platforms. Reviews serve as the primary source of information about products and services. Authentic reviews play a vital role in consumer decision-making. The presence of fabricated content misleads consumers, undermines trust and facilitates potential fraud in digital marketplaces. This study focuses on detecting AI-generated product reviews in Tamil and Malayalam, two low-resource languages where research in this domain is relatively under-explored. We worked on a range of approaches – from traditional machine learning methods to advanced transformer-based models such as Indic-BERT, IndicSBERT, MuRIL, XLM-RoBERTa and MalayalamBERT. Our findings highlight the effectiveness of leveraging the state-of-the-art transformers in accurately identifying AI-generated content, demonstrating the potential in enhancing the detection of fake reviews in low-resource language settings.
arxiv情報
著者 | Somsubhra De,Advait Vats |
発行日 | 2025-03-12 11:35:04+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google