要約
画像エッジ検出 (ED) は、コンピューター ビジョンの基本タスクです。
ED アルゴリズムのパフォーマンスは CNN ベースのモデルの導入により大幅に改善されましたが、現在のモデルは、特に低い誤差許容距離しか許可されない場合、依然として満足のいく精度率に悩まされています。
したがって、より正確な予測のためのモデル アーキテクチャにはまだ調査が必要です。
一方で、人間が提供する避けられないノイズ トレーニング データは、入力がエッジ マップそのものであっても、モデル予測が不満足になる可能性があるため、これも解決策が必要です。
この論文では、カスケード スキッピング密度ブロック (CSDB) を使用して、より正確な ED モデルを示します。
私たちのモデルは、広範な実験によって確認された高水準のベンチマークを超えて、いくつかのデータセット、特に平均精度率 (AP) において最先端 (SOTA) 予測を取得します。
また、トレーニング用のデータ拡張に関する新しい修正が採用されており、これによりノイズのないデータを初めてモデルのトレーニングに使用できるようになり、モデルのパフォーマンスがさらに向上します。
関連する Python コードは https://github.com/Hao-B-Shu/SDPED にあります。
要約(オリジナル)
Image Edge detection (ED) is a base task in computer vision. While the performance of the ED algorithm has been improved greatly by introducing CNN-based models, current models still suffer from unsatisfactory precision rates especially when only a low error toleration distance is allowed. Therefore, model architecture for more precise predictions still needs an investigation. On the other hand, the unavoidable noise training data provided by humans would lead to unsatisfactory model predictions even when inputs are edge maps themselves, which also needs a solution. In this paper, more precise ED models are presented with cascaded skipping density blocks (CSDB). Our models obtain state-of-the-art(SOTA) predictions in several datasets, especially in average precision rate (AP), over a high-standard benchmark, which is confirmed by extensive experiments. Also, a novel modification on data augmentation for training is employed, which allows noiseless data to be employed in model training for the first time, and thus further improves the model performance. The relative Python codes can be found on https://github.com/Hao-B-Shu/SDPED.
arxiv情報
著者 | Hao Shu |
発行日 | 2024-10-02 10:24:45+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google