pytopicgram: A library for data extraction and topic modeling from Telegram channels

要約

Telegramは、パブリックコミュニケーションに人気のあるプラットフォームであり、チャネルを通じて大量のメッセージを生成します。
Pytopicgramは、研究者がこれらの電報メッセージを収集、整理、分析するのに役立つPythonライブラリです。
ライブラリは、Easyメッセージの取得、詳細なチャネル情報、エンゲージメントメトリック、高度なモデリング手法を使用したトピック識別などの重要な機能を提供します。
データの抽出と分析を簡素化することにより、PytopicGramを使用すると、ユーザーはコンテンツの広がりとテレグラムでの視聴者の相互作用を理解できます。
このペーパーでは、\ pytopicgramのデザイン、主な機能、および実用的な使用について説明し、電報での公開会話を研究するための有効性を紹介します。

要約(オリジナル)

Telegram is a popular platform for public communication, generating large amounts of messages through its channels. pytopicgram is a Python library that helps researchers collect, organize, and analyze these Telegram messages. The library offers key features such as easy message retrieval, detailed channel information, engagement metrics, and topic identification using advanced modeling techniques. By simplifying data extraction and analysis, pytopicgram allows users to understand how content spreads and how audiences interact on Telegram. This paper describes the design, main features, and practical uses of \pytopicgram, showcasing its effectiveness for studying public conversations on Telegram.

arxiv情報

著者 J. Gómez-Romero,J. Cantón Correa,R. Pérez Mercado,F. Prados Abad,M. Molina-Solana,W. Fajardo
発行日 2025-02-07 12:41:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク