要約
畳み込みと自己関節のメカニズムは、深い学習において建築設計を支配していますが、この調査では、根本的ではあるが理解されていない原始であるHadamard製品を検証しています。
さまざまなアプリケーションにわたる広範な実装にもかかわらず、Hadamard製品はコアアーキテクチャプリミティブとして体系的に分析されていません。
高次相関、マルチモーダルデータ融合、動的表現変調、および効率的なペアワイズ操作の4つの主要なドメインを識別し、ディープラーニングにおけるアプリケーションの最初の包括的な分類法を提示します。
Hadamard製品の非線形相互作用を線形計算の複雑さとモデル化する能力は、リソースに制約のある展開とエッジコンピューティングシナリオにとって特に価値があります。
視覚的な質問への回答などのマルチモーダル融合タスクにおけるその自然な適用性、および画像の開始や剪定などのアプリケーションの表現マスキングにおけるその有効性を実証します。
この系統的レビューは、深い学習アーキテクチャにおけるHadamard製品の役割に関する既存の知識を統合するだけでなく、将来の建築革新の基盤を確立します。
私たちの分析により、Hadamard製品は、計算効率と表現力の間の説得力のあるトレードオフを提供し、深い学習ツールキットの重要なコンポーネントとして配置する多目的な原始的な原始として明らかになりました。
要約(オリジナル)
While convolution and self-attention mechanisms have dominated architectural design in deep learning, this survey examines a fundamental yet understudied primitive: the Hadamard product. Despite its widespread implementation across various applications, the Hadamard product has not been systematically analyzed as a core architectural primitive. We present the first comprehensive taxonomy of its applications in deep learning, identifying four principal domains: higher-order correlation, multimodal data fusion, dynamic representation modulation, and efficient pairwise operations. The Hadamard product’s ability to model nonlinear interactions with linear computational complexity makes it particularly valuable for resource-constrained deployments and edge computing scenarios. We demonstrate its natural applicability in multimodal fusion tasks, such as visual question answering, and its effectiveness in representation masking for applications including image inpainting and pruning. This systematic review not only consolidates existing knowledge about the Hadamard product’s role in deep learning architectures but also establishes a foundation for future architectural innovations. Our analysis reveals the Hadamard product as a versatile primitive that offers compelling trade-offs between computational efficiency and representational power, positioning it as a crucial component in the deep learning toolkit.
arxiv情報
著者 | Grigorios G Chrysos,Yongtao Wu,Razvan Pascanu,Philip Torr,Volkan Cevher |
発行日 | 2025-04-17 17:26:29+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google