Rethinking SO(3)-equivariance with Bilinear Tensor Networks

要約

科学および工学アプリケーションの多くのデータセットは、特定の幾何学的構造を持つオブジェクトで構成されています。
一般的な例は、3D 回転のグループ SO$(3)$ の表現に存在するデータです: スカラー、ベクトル、テンソル、\textit{etc}。
ニューラル ネットワークがこの構造の事前知識を利用する 1 つの方法は、層全体に SO$(3)$ 等価性を適用することであり、そのようなアーキテクチャがいくつか提案されています。
任意の SO$(3)$ 表現を処理する一般的な方法は存在しますが、計算量が多く、実装が複雑です。
賢明な対称性の破れにより、SO$(2)$ のベクトルおよび次数 2 テンソル表現のみで動作するネットワークの表現力を効率的に高めることができることを示します。
\textit{b-tagging} として知られる高エネルギー物理学の重要な問題に関する方法を示します。この問題では、b 中間子崩壊から発生する粒子ジェットを圧倒的な QCD バックグラウンドから区別する必要があります。
このタスクでは、標準アーキテクチャをこの方法で補強すると、拒否スコアが \ensuremath{2.3\times} 向上することがわかります。

要約(オリジナル)

Many datasets in scientific and engineering applications are comprised of objects which have specific geometric structure. A common example is data which inhabits a representation of the group SO$(3)$ of 3D rotations: scalars, vectors, tensors, \textit{etc}. One way for a neural network to exploit prior knowledge of this structure is to enforce SO$(3)$-equivariance throughout its layers, and several such architectures have been proposed. While general methods for handling arbitrary SO$(3)$ representations exist, they computationally intensive and complicated to implement. We show that by judicious symmetry breaking, we can efficiently increase the expressiveness of a network operating only on vector and order-2 tensor representations of SO$(2)$. We demonstrate the method on an important problem from High Energy Physics known as \textit{b-tagging}, where particle jets originating from b-meson decays must be discriminated from an overwhelming QCD background. In this task, we find that augmenting a standard architecture with our method results in a \ensuremath{2.3\times} improvement in rejection score.

arxiv情報

著者 Chase Shimmin,Zhelun Li,Ema Smith
発行日 2023-03-20 17:23:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, hep-ex, hep-ph パーマリンク