How to use LLMs for Text Analysis

要約

このガイドでは、社会科学における汎用性の高いテキスト分析手法として大規模言語モデル (LLM) を紹介します。
LLM は使いやすく、安価で高速で、テキストの注釈や分類から感情分析や批判的談話分析に至るまで、幅広いテキスト分析タスクに適用できるため、多くの学者は、LLM がテキスト分析の方法を変えると信じています。

このハウツー ガイドは、プログラミング経験が限られている学生や研究者を対象としており、独自の研究プロジェクトでテキスト分析に LLM を使用する方法についての簡単な紹介と、ベスト プラクティスに関するアドバイスを提供します。
Python を使用して LLM でテキスト データを分析する各ステップ (ソフトウェアのインストール、API のセットアップ、データのロード、分析プロンプトの作成、テキストの分析、結果の検証) を説明します。
わかりやすい例として、政治文書の中のポピュリズムを特定するという難しい課題を取り上げ、LLM が既存の最先端技術をどのように超えていくかを示します。

要約(オリジナル)

This guide introduces Large Language Models (LLM) as a highly versatile text analysis method within the social sciences. As LLMs are easy-to-use, cheap, fast, and applicable on a broad range of text analysis tasks, ranging from text annotation and classification to sentiment analysis and critical discourse analysis, many scholars believe that LLMs will transform how we do text analysis. This how-to guide is aimed at students and researchers with limited programming experience, and offers a simple introduction to how LLMs can be used for text analysis in your own research project, as well as advice on best practices. We will go through each of the steps of analyzing textual data with LLMs using Python: installing the software, setting up the API, loading the data, developing an analysis prompt, analyzing the text, and validating the results. As an illustrative example, we will use the challenging task of identifying populism in political texts, and show how LLMs move beyond the existing state-of-the-art.

arxiv情報

著者 Petter Törnberg
発行日 2023-07-24 19:54:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク