Linear Object Detection in Document Images using Multiple Object Tracking

要約

線状オブジェクトは文書構造に関する重要な情報を伝えますが、劣化 (湾曲、消去) または装飾 (二重、破線) のため、正確に検出するのは困難です。
多くの手法である程度のベクトル表現を復元できますが、1994 年に導入されたクローズドソース手法は 1 つだけで、カルマン フィルター (複数オブジェクト追跡アルゴリズムの特定のケース) に基づいており、線形オブジェクトのピクセル精度のインスタンス セグメンテーションを実行し、選択的に削除することができます。
元の画像からのものです。
我々は、このアプローチを再普及させることを目指し、次のことを提案します。 1. 複数オブジェクト追跡 (MOT) を使用して、ドキュメント画像内の線形オブジェクトのインスタンスを正確にセグメント化するためのフレームワーク。
2. 線状オブジェクト検出のベクトルベースとピクセルベースの両方の評価を可能にするドキュメント画像データセットとメトリクス。
3. 最新のセグメント検出器に対する MOT アプローチのパフォーマンス測定。
4. さまざまな追跡戦略のパフォーマンス測定。元のカルマン フィルター アプローチの代替案を示します。
5. 曲線、消去、破線、交差および/または重なり合う線状オブジェクトのインスタンスを識別できる検出器のオープンソース実装。

要約(オリジナル)

Linear objects convey substantial information about document structure, but are challenging to detect accurately because of degradation (curved, erased) or decoration (doubled, dashed). Many approaches can recover some vector representation, but only one closed-source technique introduced in 1994, based on Kalman filters (a particular case of Multiple Object Tracking algorithm), can perform a pixel-accurate instance segmentation of linear objects and enable to selectively remove them from the original image. We aim at re-popularizing this approach and propose: 1. a framework for accurate instance segmentation of linear objects in document images using Multiple Object Tracking (MOT); 2. document image datasets and metrics which enable both vector- and pixel-based evaluation of linear object detection; 3. performance measures of MOT approaches against modern segment detectors; 4. performance measures of various tracking strategies, exhibiting alternatives to the original Kalman filters approach; and 5. an open-source implementation of a detector which can discriminate instances of curved, erased, dashed, intersecting and/or overlapping linear objects.

arxiv情報

著者 Philippe Bernet,Joseph Chazalon,Edwin Carlinet,Alexandre Bourquelot,Elodie Puybareau
発行日 2023-05-26 14:22:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク