Tangling-Untangling Cycle for Efficient Learning


多様体学習の従来の常識は、IsoMAP や局所線形埋め込み (LLE) などの非線形次元削減技術に基づいています。
この研究によってもたらされた新しい洞察は、リフトされた高次元空間のコンテキスト変数としてクラス ラベルを導入することです (したがって、教師あり学習は教師なし学習になります)。
避けられない過学習を修正するために、一般化にとって重要である多様体のもつれを解く二重プロセス (もつれまたはエイリアシング) を考慮します。
コンテキストを結合要素として使用して、もつれ-もつれ解除サイクル (TUC) として知られる、多様体もつれを解く演算子ともつれを解く演算子のペアを構築します。
アンタングル演算子は、コンテキストを隠れ変数として誘導することにより、低次元空間のコンテキスト独立表現 (CIR) を高次元空間のコンテキスト依存表現 (CDR) にマッピングします。
タングル演算子は、不変性と一般化のための単純な積分変換によって CDR を CIR にマッピングし直します。
また、デカルト積とフラクタル幾何学に基づいた TUC の階層的拡張も示します。
概念的な単純さにも関わらず、TUC は、多同期ニューラル グループ (PNG) と睡眠覚醒サイクル (SWC) のタイムロック動作に基づいた、生物学的に妥当でエネルギー効率の高い実装を認めています。
TUC に基づく理論は、海馬-新皮質システムによるさまざまな認知機能の計算モデリングに適用されます。


The conventional wisdom of manifold learning is based on nonlinear dimensionality reduction techniques such as IsoMAP and locally linear embedding (LLE). We challenge this paradigm by exploiting the blessing of dimensionality. Our intuition is simple: it is easier to untangle a low-dimensional manifold in a higher-dimensional space due to its vastness, as guaranteed by Whitney embedding theorem. A new insight brought by this work is to introduce class labels as the context variables in the lifted higher-dimensional space (so supervised learning becomes unsupervised learning). We rigorously show that manifold untangling leads to linearly separable classifiers in the lifted space. To correct the inevitable overfitting, we consider the dual process of manifold untangling — tangling or aliasing — which is important for generalization. Using context as the bonding element, we construct a pair of manifold untangling and tangling operators, known as tangling-untangling cycle (TUC). Untangling operator maps context-independent representations (CIR) in low-dimensional space to context-dependent representations (CDR) in high-dimensional space by inducing context as hidden variables. The tangling operator maps CDR back to CIR by a simple integral transformation for invariance and generalization. We also present the hierarchical extensions of TUC based on the Cartesian product and the fractal geometry. Despite the conceptual simplicity, TUC admits a biologically plausible and energy-efficient implementation based on the time-locking behavior of polychronization neural groups (PNG) and sleep-wake cycle (SWC). The TUC-based theory applies to the computational modeling of various cognitive functions by hippocampal-neocortical systems.


著者 Xin Li
発行日 2024-04-08 13:06:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク