pyBibX — A Python Library for Bibliometric and Scientometric Analysis Powered with Artificial Intelligence Tools


タイトル: pyBibX-人工知能ツールを活用した文献計量学・科学指標分析のためのPythonライブラリ
– Bibliometric and Scientometric分析には、多様な学術分野にまたがる複雑な研究地形と協力ダイナミクスに対する貴重な視点がある。
– pyBibXは、Scopus、Web of Science、PubMedからの生データファイルを用いて包括的な文献計量学・科学指標分析を実施するよう設計されたPythonライブラリである。
– ライブラリはAI能力を統合し、Embedding vectors、Topic Modeling、Text Summarizationなどの自然言語処理タスクを使用して、Sentence-BERT、BerTopic、BERT、chatGPT、PEGASUSなどのモデルを活用している。
– 184件の論文を分析した結果、決定論とファジィ論理手法への関心の高まりが強調され、カナダと中国が重要な協力ハブであることが判明した。
– pyBibXは、科学出版物の分析に先駆的なAI能力を統合した初のアプリケーションであり、研究者がこれらの結果をより効果的に調査・解釈することを可能にする。


Bibliometric and Scientometric analyses offer invaluable perspectives on the complex research terrain and collaborative dynamics spanning diverse academic disciplines. This paper presents pyBibX, a python library devised to conduct comprehensive bibliometric and scientometric analyses on raw data files sourced from Scopus, Web of Science, and PubMed, seamlessly integrating state of the art AI capabilities into its core functionality. The library executes a comprehensive EDA, presenting outcomes via visually appealing graphical illustrations. Network capabilities have been deftly integrated, encompassing Citation, Collaboration, and Similarity Analysis. Furthermore, the library incorporates AI capabilities, including Embedding vectors, Topic Modeling, Text Summarization, and other general Natural Language Processing tasks, employing models such as Sentence-BERT, BerTopic, BERT, chatGPT, and PEGASUS. As a demonstration, we have analyzed 184 documents associated with multiple-criteria decision analysis published between 1984 and 2023. The EDA emphasized a growing fascination with decision-making and fuzzy logic methodologies. Next, Network Analysis further accentuated the significance of central authors and intra-continental collaboration, identifying Canada and China as crucial collaboration hubs. Finally, AI Analysis distinguished two primary topics and chatGPT preeminence in Text Summarization. It also proved to be an indispensable instrument for interpreting results, as our library enables researchers to pose inquiries to chatGPT regarding bibliometric outcomes. Even so, data homogeneity remains a daunting challenge due to database inconsistencies. PyBibX is the first application integrating cutting-edge AI capabilities for analyzing scientific publications, enabling researchers to examine and interpret these outcomes more effectively.


著者 Valdecy Pereira,Marcio Pereira Basilio,Carlos Henrique Tarjano Santos
発行日 2023-04-27 20:06:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.AI, cs.DL パーマリンク