Labeled Interactive Topic Models

要約

トピック モデルは、広範なドキュメント コレクションを理解するのに役立ちますが、最も関連性の高いトピックを常に特定できるわけではありません。
古典的な確率論的およびアンカーベースのトピック モデルは、ユーザーがモデルをより適切なトピックに導くことを可能にする対話型バージョンを提供します。
しかし、このようなインタラクティブな機能はニューラル トピック モデルには欠けていました。
この不足を修正するために、ニューラル トピック モデルにユーザーフレンドリーなインタラクションを導入します。
この対話により、ユーザーはトピックに単語ラベルを割り当てることができ、トピック モデルが更新され、トピック内の単語が指定されたラベルと厳密に一致するようになります。
私たちのアプローチには、2 つの異なる種類のニューラル トピック モデルが含まれています。
1 つ目には、トピックの埋め込みがトレーニング可能であり、トレーニング プロセス中に進化するモデルが含まれます。
2 番目の種類には、トピックの埋め込みがトレーニング後に統合されるモデルが含まれており、トピックの改良に別のアプローチを提供します。
これらのニューラル トピック モデルとのユーザー対話を容易にするために、対話型インターフェイスを開発しました。
このインターフェイスにより、ユーザーは必要に応じてトピックに関与したり、トピックにラベルを付け直したりすることができます。
私たちは、ユーザーがトピックのラベルを変更して関連するドキュメントを見つけることができる人間の研究を通じてメソッドを評価します。
私たちの方法を使用すると、ユーザーのラベル付けによりドキュメントのランク スコアが向上し、ユーザーのラベル付けがない場合と比較して、特定のクエリに関連するドキュメントをより多く見つけることができます。

要約(オリジナル)

Topic models are valuable for understanding extensive document collections, but they don’t always identify the most relevant topics. Classical probabilistic and anchor-based topic models offer interactive versions that allow users to guide the models towards more pertinent topics. However, such interactive features have been lacking in neural topic models. To correct this lacuna, we introduce a user-friendly interaction for neural topic models. This interaction permits users to assign a word label to a topic, leading to an update in the topic model where the words in the topic become closely aligned with the given label. Our approach encompasses two distinct kinds of neural topic models. The first includes models where topic embeddings are trainable and evolve during the training process. The second kind involves models where topic embeddings are integrated post-training, offering a different approach to topic refinement. To facilitate user interaction with these neural topic models, we have developed an interactive interface. This interface enables users to engage with and re-label topics as desired. We evaluate our method through a human study, where users can relabel topics to find relevant documents. Using our method, user labeling improves document rank scores, helping to find more relevant documents to a given query when compared to no user labeling.

arxiv情報

著者 Kyle Seelman,Mozhi Zhang,Jordan Boyd-Graber
発行日 2024-02-07 14:41:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.HC, cs.IR, cs.LG パーマリンク