Toward an Over-parameterized Direct-Fit Model of Visual Perception

要約

この論文では、視覚認知の過度にパラメータ化された直接適合モデルのための単純および複雑な細胞の計算モデリングの問題を再検討します。
従来の通念とは異なり、単純な細胞と複雑な細胞の間の並列結合メカニズムと順次結合メカニズムの違いを強調します。
それらを空間分割と合成に抽象化するための新しい提案は、私たちの新しい階層構造の基礎として開発されています。
私たちの構築は、既存のkdツリーの製品トポロジーベースの一般化として解釈でき、高次元空間でのブルートフォース直接適合に適しています。
構築されたモデルは、神経科学と心理学におけるいくつかの古典的な実験に適用されています。
構築されたビジョン モデルのアンチ スパース コーディングの解釈を提供し、それが $\ell_{\infty}$ 最適化に基づく動的計画法 (DP) のような近似最近傍検索にどのようにつながるかを示します。
また、非対称 (デコーダーの方が重要) オートエンコーダーとスパイキング ニューラル ネットワーク (SNN) に基づく 2 つの可能な実装についても簡単に説明します。

要約(オリジナル)

In this paper, we revisit the problem of computational modeling of simple and complex cells for an over-parameterized and direct-fit model of visual perception. Unlike conventional wisdom, we highlight the difference in parallel and sequential binding mechanisms between simple and complex cells. A new proposal for abstracting them into space partitioning and composition is developed as the foundation of our new hierarchical construction. Our construction can be interpreted as a product topology-based generalization of the existing k-d tree, making it suitable for brute-force direct-fit in a high-dimensional space. The constructed model has been applied to several classical experiments in neuroscience and psychology. We provide an anti-sparse coding interpretation of the constructed vision model and show how it leads to a dynamic programming (DP)-like approximate nearest-neighbor search based on $\ell_{\infty}$-optimization. We also briefly discuss two possible implementations based on asymmetrical (decoder matters more) auto-encoder and spiking neural networks (SNN), respectively.

arxiv情報

著者 Xin Li
発行日 2022-10-11 15:37:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク