REALM: A Dataset of Real-World LLM Use Cases

要約

GPTシリーズなどの大規模な言語モデルは、重要な産業用途を推進しており、経済的および社会的変革につながりました。
ただし、実際のアプリケーションの包括的な理解は依然として限られています。
これに対処するために、Redditおよびニュース記事から収集された94,000を超えるLLMユースケースのデータセットであるRealmを紹介します。
Realmは、LLMSの多様なアプリケーションとユーザーの人口統計の2つの重要な側面を捉えています。
LLMアプリケーションを分類し、ユーザーの職業が使用するアプリケーションの種類にどのように関連しているかを調査します。
現実世界のデータを統合することにより、RealmはさまざまなドメインにわたるLLM採用に関する洞察を提供し、進化する社会的役割に関する将来の研究の基盤を提供します。
専用のダッシュボードhttps://realm-e7682.web.app/データを提示します。

要約(オリジナル)

Large Language Models, such as the GPT series, have driven significant industrial applications, leading to economic and societal transformations. However, a comprehensive understanding of their real-world applications remains limited. To address this, we introduce REALM, a dataset of over 94,000 LLM use cases collected from Reddit and news articles. REALM captures two key dimensions: the diverse applications of LLMs and the demographics of their users. It categorizes LLM applications and explores how users’ occupations relate to the types of applications they use. By integrating real-world data, REALM offers insights into LLM adoption across different domains, providing a foundation for future research on their evolving societal roles. A dedicated dashboard https://realm-e7682.web.app/ presents the data.

arxiv情報

著者 Jingwen Cheng,Kshitish Ghate,Wenyue Hua,William Yang Wang,Hong Shen,Fei Fang
発行日 2025-03-24 15:39:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.CY, cs.HC パーマリンク