appjsonify: An Academic Paper PDF-to-JSON Conversion Toolkit

要約

appjsonifyは、PythonベースのPDFからJSONへの変換ツールキットである。appjsonifyは柔軟なツールであり、ユーザが処理したい論文の特定のフォーマットを扱うために、処理パイプラインを簡単に構成することができます。私たちは、appjsonifyを、PyPIとGitHubを通じて入手可能な、簡単にインストールできるツールキットとして一般に公開しています。

要約(オリジナル)

We present appjsonify, a Python-based PDF-to-JSON conversion toolkit for academic papers. It parses a PDF file using several visual-based document layout analysis models and rule-based text processing approaches. appjsonify is a flexible tool that allows users to easily configure the processing pipeline to handle a specific format of a paper they wish to process. We are publicly releasing appjsonify as an easy-to-install toolkit available via PyPI and GitHub.

arxiv情報

著者 Atsuki Yamaguchi,Terufumi Morishita
発行日 2023-10-03 13:19:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CL パーマリンク