要約
appjsonifyは、PythonベースのPDFからJSONへの変換ツールキットである。appjsonifyは柔軟なツールであり、ユーザが処理したい論文の特定のフォーマットを扱うために、処理パイプラインを簡単に構成することができます。私たちは、appjsonifyを、PyPIとGitHubを通じて入手可能な、簡単にインストールできるツールキットとして一般に公開しています。
要約(オリジナル)
We present appjsonify, a Python-based PDF-to-JSON conversion toolkit for academic papers. It parses a PDF file using several visual-based document layout analysis models and rule-based text processing approaches. appjsonify is a flexible tool that allows users to easily configure the processing pipeline to handle a specific format of a paper they wish to process. We are publicly releasing appjsonify as an easy-to-install toolkit available via PyPI and GitHub.
arxiv情報
著者 | Atsuki Yamaguchi,Terufumi Morishita |
発行日 | 2023-10-03 13:19:40+00:00 |
arxivサイト | arxiv_id(pdf) |