要約
私たちは、各ユニットの状態が複素数で与えられるリカレント ニューラル ネットワークにおける時空間ダイナミクスを使用した画像セグメンテーションを研究します。
このネットワークが、シーンの構造的特徴に従って画像を効果的にグループに分割できる高度な時空間ダイナミクスを生成することを示します。
リカレント ネットワークのダイナミクスの正確な解を使用して、このネットワークにおけるオブジェクト セグメンテーションの基礎となるメカニズムを正確に説明し、ネットワークがこのタスクをどのように実行するかについての明確な数学的解釈を提供します。
次に、グレースケール画像の単純な幾何学的オブジェクトから自然画像に至るまで、入力全体を一般化するオブジェクト セグメンテーションの単純なアルゴリズムを示します。
すべての画像にわたるオブジェクトのセグメンテーションは、単一の固定セットの重みを持つ 1 つのリカレント ニューラル ネットワークで実行されます。
これは、リカレント ニューラル ネットワークの構造、ダイナミクス、計算を統合する数学的アプローチを使用して構築された場合の表現力の可能性を示しています。
要約(オリジナル)
We study image segmentation using spatiotemporal dynamics in a recurrent neural network where the state of each unit is given by a complex number. We show that this network generates sophisticated spatiotemporal dynamics that can effectively divide an image into groups according to a scene’s structural characteristics. Using an exact solution of the recurrent network’s dynamics, we present a precise description of the mechanism underlying object segmentation in this network, providing a clear mathematical interpretation of how the network performs this task. We then demonstrate a simple algorithm for object segmentation that generalizes across inputs ranging from simple geometric objects in grayscale images to natural images. Object segmentation across all images is accomplished with one recurrent neural network that has a single, fixed set of weights. This demonstrates the expressive potential of recurrent neural networks when constructed using a mathematical approach that brings together their structure, dynamics, and computation.
arxiv情報
著者 | Luisa H. B. Liboni,Roberto C. Budzinski,Alexandra N. Busch,Sindy Löwe,Thomas A. Keller,Max Welling,Lyle E. Muller |
発行日 | 2023-11-28 16:46:44+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google