Enhancing Complex Formula Recognition with Hierarchical Detail-Focused Network

要約

階層的で複雑な数式認識 (MER) は、数式の解釈が複数あるため困難であり、解析と評価の両方が複雑になります。
このペーパーでは、これらの問題に対処するために特別に設計された最初のデータセットである、階層的詳細重視認識データセット (HDR) を紹介します。
これは大規模なトレーニング セットである HDR-100M で構成されており、1 億のトレーニング インスタンスを備えた前例のない規模と多様性を提供します。
また、テスト セットである HDR-Test には、包括的なモデルのパフォーマンスを評価するための複雑な階層式の複数の解釈が含まれています。
さらに、複雑な数式の解析では、詳細な部分でエラーが発生することがよくあります。
これに対処するために、階層的なサブ式モジュールを組み込んだ革新的なフレームワークである Hierarchical Detail-Focused Recognition Network (HDNet) を提案します。これは、式の詳細の正確な処理に焦点を当て、それによって MER のパフォーマンスを大幅に向上させます。
実験結果は、HDNet がさまざまなデータセットにわたって既存の MER モデルよりも優れたパフォーマンスを発揮することを示しています。

要約(オリジナル)

Hierarchical and complex Mathematical Expression Recognition (MER) is challenging due to multiple possible interpretations of a formula, complicating both parsing and evaluation. In this paper, we introduce the Hierarchical Detail-Focused Recognition dataset (HDR), the first dataset specifically designed to address these issues. It consists of a large-scale training set, HDR-100M, offering an unprecedented scale and diversity with one hundred million training instances. And the test set, HDR-Test, includes multiple interpretations of complex hierarchical formulas for comprehensive model performance evaluation. Additionally, the parsing of complex formulas often suffers from errors in fine-grained details. To address this, we propose the Hierarchical Detail-Focused Recognition Network (HDNet), an innovative framework that incorporates a hierarchical sub-formula module, focusing on the precise handling of formula details, thereby significantly enhancing MER performance. Experimental results demonstrate that HDNet outperforms existing MER models across various datasets.

arxiv情報

著者 Jiale Wang,Junhui Yu,Huanyong Liu,Chenanran Kong
発行日 2025-01-09 09:18:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク