Interactive Concept Learning for Uncovering Latent Themes in Large Text Collections

要約

タイトル: 大規模テキストコレクションにおける潜在的テーマの発見のためのインタラクティブな概念学習

要約:
– 多様な分野の専門家は、大きなテキストコレクションを理解することに興味を持っています。
– これには、トピックモデルのようなノイズの多い非監督技術を使用するか、手動のテーマ発見プロセスに従うことが通常必要とされます。
– 本論文では、専門家が関連性のある汎用的な概念を含むテーマの定義を拡張し、手動コーディングの手間を軽減しながら専門家の制御下で研究を進めるためのインタラクティブなフレームワークを提案します。

要約(オリジナル)

Experts across diverse disciplines are often interested in making sense of large text collections. Traditionally, this challenge is approached either by noisy unsupervised techniques such as topic models, or by following a manual theme discovery process. In this paper, we expand the definition of a theme to account for more than just a word distribution, and include generalized concepts deemed relevant by domain experts. Then, we propose an interactive framework that receives and encodes expert feedback at different levels of abstraction. Our framework strikes a balance between automation and manual coding, allowing experts to maintain control of their study while reducing the manual effort required.

arxiv情報

著者 Maria Leonor Pacheco,Tunazzina Islam,Lyle Ungar,Ming Yin,Dan Goldwasser
発行日 2023-05-08 23:43:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL, cs.HC パーマリンク