要約
何がデータ分布を深層学習に適したものにするのかという問題は、基本的な未解決の問題です。
ローカルに接続されたニューラル ネットワーク (畳み込みニューラル ネットワークやリカレント ニューラル ネットワーク、ローカル セルフ アテンション モデルを含む一般的なアーキテクチャ ファミリ) に焦点を当て、量子物理学の理論ツールを採用することでこの問題に対処します。
私たちの主な理論的結果は、特定の局所的に接続されたニューラル ネットワークは、データ分布が特定の標準的な特徴分割の下で低い量子もつれを許容する場合に限り、データ分布を正確に予測できることを示しています。
この結果の実践的な応用として、ローカルに接続されたニューラル ネットワークへのデータ分布の適合性を高めるための前処理手法を導出します。
さまざまなデータセットにわたる広範なモデルを使用した実験により、私たちの発見が実証されました。
私たちは、量子もつれを利用することで、ディープラーニングと実世界のデータとの関係を正式に推論するための物理学ツールのさらなる採用が促進されることを期待しています。
要約(オリジナル)
The question of what makes a data distribution suitable for deep learning is a fundamental open problem. Focusing on locally connected neural networks (a prevalent family of architectures that includes convolutional and recurrent neural networks as well as local self-attention models), we address this problem by adopting theoretical tools from quantum physics. Our main theoretical result states that a certain locally connected neural network is capable of accurate prediction over a data distribution if and only if the data distribution admits low quantum entanglement under certain canonical partitions of features. As a practical application of this result, we derive a preprocessing method for enhancing the suitability of a data distribution to locally connected neural networks. Experiments with widespread models over various datasets demonstrate our findings. We hope that our use of quantum entanglement will encourage further adoption of tools from physics for formally reasoning about the relation between deep learning and real-world data.
arxiv情報
著者 | Yotam Alexander,Nimrod De La Vega,Noam Razin,Nadav Cohen |
発行日 | 2023-10-26 16:10:27+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google