要約
光学的化学構造認識の主な目的は、化学構造画像を対応するマークアップ配列に識別することである。しかし、分子の複雑な2次元構造、特に環や複数の分岐を持つ構造は、1次元のマークアップを直接学習する現在のエンドツーエンドの手法にとって大きな課題となっている。この制限を克服するために、我々は、化学構造を階層的に記述するための分割統治戦略を利用した、新しいリングフリー言語(RFL)を提案する。RFLは、複雑な分子構造を複数の部分に分解することを可能にし、可読性を向上させながら、一意性と簡潔性の両方を保証する。このアプローチにより、認識モデルの学習難易度が大幅に軽減される。RFLを活用し、分子骨格と個々の環を段階的に予測する骨格生成モジュールと、枝情報を予測する枝分類モジュールから構成される、普遍的な分子骨格デコーダ(MSD)を提案する。実験結果は、提案するRFLとMSDが様々な主流手法に適用可能であり、印刷と手書きの両方のシナリオにおいて、最先端のアプローチと比較して優れた性能を達成することを示している。コードはhttps://github.com/JingMog/RFL-MSD。
要約(オリジナル)
The primary objective of Optical Chemical Structure Recognition is to identify chemical structure images into corresponding markup sequences. However, the complex two-dimensional structures of molecules, particularly those with rings and multiple branches, present significant challenges for current end-to-end methods to learn one-dimensional markup directly. To overcome this limitation, we propose a novel Ring-Free Language (RFL), which utilizes a divide-and-conquer strategy to describe chemical structures in a hierarchical form. RFL allows complex molecular structures to be decomposed into multiple parts, ensuring both uniqueness and conciseness while enhancing readability. This approach significantly reduces the learning difficulty for recognition models. Leveraging RFL, we propose a universal Molecular Skeleton Decoder (MSD), which comprises a skeleton generation module that progressively predicts the molecular skeleton and individual rings, along with a branch classification module for predicting branch information. Experimental results demonstrate that the proposed RFL and MSD can be applied to various mainstream methods, achieving superior performance compared to state-of-the-art approaches in both printed and handwritten scenarios. The code is available at https://github.com/JingMog/RFL-MSD.
arxiv情報
著者 | Qikai Chang,Mingjun Chen,Changpeng Pi,Pengfei Hu,Zhenrong Zhang,Jiefeng Ma,Jun Du,Baocai Yin,Jinshui Hu |
発行日 | 2025-02-03 09:35:15+00:00 |
arxivサイト | arxiv_id(pdf) |