On representation of natural image patches

要約

最初の原則から始めて、自然画像の局所統計をモデル化する偶数コードという名前の教師なし学習方法を導き出します。
最初のバージョンでは、独立した状態を持つ直交基底を使用して、いくつかのピクセルの単純な確率分布をモデル化します。
2 番目のバージョンでは、微視的損失関数を使用して、画像パッチの非線形スパース バイナリ表現を学習します。
バイナリ表現空間の距離は、画像パッチの類似性を反映しています。
学習されたモデルには、初期の視覚システムのようなローカル エッジ検出ユニットと方向選択ユニットもあります。

要約(オリジナル)

Starting from the first principle I derive an unsupervised learning method named even code to model local statistics of natural images. The first version uses orthogonal bases with independent states to model simple probability distribution of a few pixels. The second version uses a microscopic loss function to learn a nonlinear sparse binary representation of image patches. The distance in the binary representation space reflects image patch similarity. The learned model also has local edge detecting and orientation selective units like early visual systems.

arxiv情報

著者 Cheng Guo
発行日 2022-10-24 07:50:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV, q-bio.NC パーマリンク