Causal Deep Learning

要約

私たちは、因果的ディープ ニューラル ネットワークのセットを導出します。そのアーキテクチャは、順方向および逆方向の因果推論を容易にするフレームワークであるテンソル (多重線形) 因子分析の結果です。
前方因果的質問は、因果カプセルとテンソル変換器で構成されるニューラル アーキテクチャで対処されます。
因果カプセルは、相互作用がテンソル変換によって制御される一連の不変因果因子表現を計算します。
逆因果関係の質問は、多重線形投影アルゴリズムを実装するニューラル ネットワークで対処されます。
このアーキテクチャは、フォワード ニューラル ネットワークの動作順序を逆にして、影響の原因を推定します。
本質的に過小決定逆問題をカモフラージュする可能性のある積極的なボトルネック次元削減や正則化回帰の代替として、多重線形射影が複数の候補解を生成する区分的テンソル モデルを使用して、データ形成メカニズムのさまざまな側面をモデル化することを規定します。
順方向の質問と逆方向の質問は浅いアーキテクチャで対処できますが、計算的にスケーラブルなソリューションの場合は、ブロック代数を利用してディープ ニューラル ネットワークのセットを導出します。
インターリーブされたカーネル階層により、二重非線形テンソル因子モデルが生成されます。
テンソル因子分析の結果である因果的ニューラル ネットワークはデータに依存しませんが、顔の画像で示されています。
逐次、並列、非同期の並列計算戦略について説明します。

要約(オリジナル)

We derive a set of causal deep neural networks whose architectures are a consequence of tensor (multilinear) factor analysis, a framework that facilitates forward and inverse causal inference. Forward causal questions are addressed with a neural architecture composed of causal capsules and a tensor transformer. Causal capsules compute a set of invariant causal factor representations, whose interactions are governed by a tensor transformation. Inverse causal questions are addressed with a neural network that implements the multilinear projection algorithm. The architecture reverses the order of the operations of a forward neural network and estimates the causes of effects. As an alternative to aggressive bottleneck dimension reduction or regularized regression that may camouflage an inherently underdetermined inverse problem, we prescribe modeling different aspects of the mechanism of data formation with piecewise tensor models whose multilinear projections produce multiple candidate solutions. Our forward and inverse questions may be addressed with shallow architectures, but for computationally scalable solutions, we derive a set of deep neural networks by taking advantage of block algebra. An interleaved kernel hierarchy results in a doubly non-linear tensor factor models. The causal neural networks that are a consequence of tensor factor analysis are data agnostic, but are illustrated with facial images. Sequential, parallel and asynchronous parallel computation strategies are described.

arxiv情報

著者 M. Alex O. Vasilescu
発行日 2024-12-23 16:48:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, I.2.10 パーマリンク