Explainable Equivariant Neural Networks for Particle Physics: PELICAN


PELICAN は、素粒子物理学の問題に適用されるアーキテクチャに見られる一般的な制限を克服するために設計された、新しい順列等変およびローレンツ不変または共変アグリゲーター ネットワークです。
基礎となる物理原理を無視し、非常に多くのパラメータを必要とする非特化アーキテクチャを使用する多くのアプローチと比較して、PELICAN は基本的に対称グループベースのアーキテクチャを採用しており、複雑さの軽減、解釈可能性の向上、および生のパフォーマンスの点で利点を示しています。
また、PELICAN の応用を、クォーク開始ジェ​​ットとグルーオン開始ジェットを識別するタスク、および 5 つの異なるターゲット カテゴリにわたるジェットのマルチクラス識別に拡張します。
ローレンツブーストトップクォークタグ付けの標準タスクでテストした場合、PELICAN は、モデルの複雑さがはるかに低く、サンプル効率が高いため、既存の競合製品よりも優れたパフォーマンスを発揮します。
4 運動量回帰というあまり一般的ではない、より複雑なタスクでも、PELICAN は機械学習ではない手作りのアルゴリズムよりも優れたパフォーマンスを発揮します。


PELICAN is a novel permutation equivariant and Lorentz invariant or covariant aggregator network designed to overcome common limitations found in architectures applied to particle physics problems. Compared to many approaches that use non-specialized architectures that neglect underlying physics principles and require very large numbers of parameters, PELICAN employs a fundamentally symmetry group-based architecture that demonstrates benefits in terms of reduced complexity, increased interpretability, and raw performance. We present a comprehensive study of the PELICAN algorithm architecture in the context of both tagging (classification) and reconstructing (regression) Lorentz-boosted top quarks, including the difficult task of specifically identifying and measuring the $W$-boson inside the dense environment of the Lorentz-boosted top-quark hadronic final state. We also extend the application of PELICAN to the tasks of identifying quark-initiated vs.~gluon-initiated jets, and a multi-class identification across five separate target categories of jets. When tested on the standard task of Lorentz-boosted top-quark tagging, PELICAN outperforms existing competitors with much lower model complexity and high sample efficiency. On the less common and more complex task of 4-momentum regression, PELICAN also outperforms hand-crafted, non-machine learning algorithms. We discuss the implications of symmetry-restricted architectures for the wider field of machine learning for physics.


著者 Alexander Bogatskiy,Timothy Hoffman,David W. Miller,Jan T. Offermann,Xiaoyang Liu
発行日 2023-10-13 16:09:19+00:00
カテゴリー: cs.LG, hep-ex, hep-ph パーマリンク