Large Language Models and Thematic Analysis: Human-AI Synergy in Researching Hate Speech on Social Media

要約

人工知能 (AI) の動的な分野では、テキスト分析のための大規模言語モデル (LLM) の開発と応用が学術的に大きな関心を集めています。
定性分析を実行する際のさまざまな LLM の有望な機能にもかかわらず、人文科学および社会科学における LLM の使用については十分に検討されていません。
この記事は、GPT-4 に関する実験研究を文書化することで、定性分析における LLM に関する新たな文献に貢献します。
この研究は、EU の資金提供を受けたプロジェクトから派生した YouTube データセットを使用してテーマ分析 (TA) を実行することに焦点を当てています。このデータセットは、以前に他の研究者によって分析されていました。
このデータセットは、2015 年の難民危機の余波が特徴的で、2017 年のスウェーデン国政選挙に先立って行われた 2016 年のスウェーデンにおけるロマ移民の代表に関するものです。私たちの研究は、人間の知能と AI の拡張性および効率性を組み合わせる可能性を理解することを目指しています。
、人文科学および社会科学の質的研究で LLM を採用する利点と限界を検討します。
さらに、これらの分野で LLM を適用するための将来の方向性についても説明します。

要約(オリジナル)

In the dynamic field of artificial intelligence (AI), the development and application of Large Language Models (LLMs) for text analysis are of significant academic interest. Despite the promising capabilities of various LLMs in conducting qualitative analysis, their use in the humanities and social sciences has not been thoroughly examined. This article contributes to the emerging literature on LLMs in qualitative analysis by documenting an experimental study involving GPT-4. The study focuses on performing thematic analysis (TA) using a YouTube dataset derived from an EU-funded project, which was previously analyzed by other researchers. This dataset is about the representation of Roma migrants in Sweden during 2016, a period marked by the aftermath of the 2015 refugee crisis and preceding the Swedish national elections in 2017. Our study seeks to understand the potential of combining human intelligence with AI’s scalability and efficiency, examining the advantages and limitations of employing LLMs in qualitative research within the humanities and social sciences. Additionally, we discuss future directions for applying LLMs in these fields.

arxiv情報

著者 Petre Breazu,Miriam Schirmer,Songbo Hu,Napoleon Kastos
発行日 2024-08-09 15:34:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.HC, cs.SI パーマリンク