MathWriting: A Dataset For Handwritten Mathematical Expression Recognition

要約

これまでで最大のオンライン手書き数式データセットである MathWriting を紹介します。
これは、23 万の人間が作成したサンプルと、さらに 40 万の合成サンプルで構成されています。
MathWriting はオフライン HME 認識にも使用でき、IM2LATEX-100K などの既存のすべてのオフライン HME データセットよりも大きくなります。
オンラインとオフラインの両方の HME 認識に関する研究を進めるために、MathWriting データに基づくベンチマークを導入します。

要約(オリジナル)

We introduce MathWriting, the largest online handwritten mathematical expression dataset to date. It consists of 230k human-written samples and an additional 400k synthetic ones. MathWriting can also be used for offline HME recognition and is larger than all existing offline HME datasets like IM2LATEX-100K. We introduce a benchmark based on MathWriting data in order to advance research on both online and offline HME recognition.

arxiv情報

著者 Philippe Gervais,Asya Fadeeva,Andrii Maksai
発行日 2024-04-16 16:10:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.HC, cs.LG パーマリンク