Enhancing API Documentation through BERTopic Modeling and Summarization


ソフトウェア開発を含むさまざまな分野でテキスト データの量が増加し続けるにつれて、有意義な洞察を効率的かつ効果的に抽出して表示することが差し迫った要求になっています。
このペーパーでは、アプリケーション プログラミング インターフェイス (API) ドキュメントの解釈の複雑さに焦点を当て、このニーズに対処するための独自のアプローチを紹介します。
公式 API ドキュメントは開発者にとって主要な情報源として機能しますが、内容が膨大で使いやすさに欠けることがよくあります。
これを考慮して、開発者は Stack Overflow や GitHub などの非公式ソースに頼ることがよくあります。
私たちの新しいアプローチでは、トピック モデリングと自然言語処理 (NLP) に BERTopic の長所を利用して、API ドキュメントの概要を自動的に生成することで、開発者が必要な情報を抽出するためのより効率的な方法を作成します。
この調査結果は、繰り返し発生するトピックについての洞察を提供し、共通の問題を特定し、潜在的な解決策を生成することにより、API ドキュメント分析の分野に貢献します。
API ドキュメントのアクセシビリティと理解効率を向上させることで、私たちの取り組みはソフトウェア開発プロセスを強化し、複雑な API を操作するための実用的なツールを開発者に提供することを目的としています。


As the amount of textual data in various fields, including software development, continues to grow, there is a pressing demand for efficient and effective extraction and presentation of meaningful insights. This paper presents a unique approach to address this need, focusing on the complexities of interpreting Application Programming Interface (API) documentation. While official API documentation serves as a primary source of information for developers, it can often be extensive and lacks user-friendliness. In light of this, developers frequently resort to unofficial sources like Stack Overflow and GitHub. Our novel approach employs the strengths of BERTopic for topic modeling and Natural Language Processing (NLP) to automatically generate summaries of API documentation, thereby creating a more efficient method for developers to extract the information they need. The produced summaries and topics are evaluated based on their performance, coherence, and interoperability. The findings of this research contribute to the field of API documentation analysis by providing insights into recurring topics, identifying common issues, and generating potential solutions. By improving the accessibility and efficiency of API documentation comprehension, our work aims to enhance the software development process and empower developers with practical tools for navigating complex APIs.


著者 AmirHossein Naghshzan,Sylvie Ratte
発行日 2023-08-17 15:57:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SE パーマリンク