要約
二値画像オペレータを設計する古典的なアプローチは数学的形態学(MM)である。我々は、二値画像解析のための離散形態ニューラルネットワーク(DMNN)を提案し、Wオペレータを表現し、機械学習によってそれらを推定する。モルフォロジー計算グラフで表現されるDMNNのアーキテクチャは、古典的なモルフォロジー演算子の発見的設計と同様に設計される。そして、いったんアーキテクチャが固定されると、そのパラメータ(すなわち、構造要素や最大区間)を手作業で調整する代わりに、通常の機械学習アプローチの下で、入力画像と出力画像のサンプルに基づいてこれらのパラメータを学習する格子勾配降下アルゴリズム(LGDA)を提案する。また、より効率的で、スケーラブルであり、実用的な問題において小さな誤差を得ることができるLGDAの確率的バージョンを提案する。DMNNによって表現されるクラスは、対象となる演算子の期待される性質、すなわち事前情報に従って、極めて一般的なものにも特殊化されたものにもなり得る。また、演算子のクラスの代数的性質によって表現される意味論は、他の手法との相対的な差異である。本論文の主な貢献は、形態素オペレータを設計するための2つの主要なパラダイム、すなわち古典的ヒューリスティック設計と機械学習による自動設計を統合したことである。従って、古典的なヒューリスティック形態素演算子設計と機械学習を融合させる。我々は、DMNNをノイズを含む数字の境界認識に適用し、今後の研究課題について議論する。
要約(オリジナル)
A classical approach to designing binary image operators is Mathematical Morphology (MM). We propose the Discrete Morphological Neural Networks (DMNN) for binary image analysis to represent W-operators and estimate them via machine learning. A DMNN architecture, which is represented by a Morphological Computational Graph, is designed as in the classical heuristic design of morphological operators, in which the designer should combine a set of MM operators and Boolean operations based on prior information and theoretical knowledge. Then, once the architecture is fixed, instead of adjusting its parameters (i.e., structural elements or maximal intervals) by hand, we propose a lattice gradient descent algorithm (LGDA) to train these parameters based on a sample of input and output images under the usual machine learning approach. We also propose a stochastic version of the LGDA that is more efficient, is scalable and can obtain small error in practical problems. The class represented by a DMNN can be quite general or specialized according to expected properties of the target operator, i.e., prior information, and the semantic expressed by algebraic properties of classes of operators is a differential relative to other methods. The main contribution of this paper is the merger of the two main paradigms for designing morphological operators: classical heuristic design and automatic design via machine learning. Thus, conciliating classical heuristic morphological operator design with machine learning. We apply the DMNN to recognize the boundary of digits with noise, and we discuss many topics for future research.
arxiv情報
著者 | Diego Marcondes,Junior Barrera |
発行日 | 2023-09-01 17:04:48+00:00 |
arxivサイト | arxiv_id(pdf) |