Explainable Equivariant Neural Networks for Particle Physics: PELICAN

要約

PELICAN は、素粒子物理学の問題に適用されるアーキテクチャに見られる一般的な制限を克服するために設計された、新しい順列等変およびローレンツ不変または共変アグリゲーター ネットワークです。
基礎となる物理原理を無視し、非常に多くのパラメータを必要とする非特化アーキテクチャを使用する多くのアプローチと比較して、PELICAN は基本的に対称グループベースのアーキテクチャを採用しており、複雑さの軽減、解釈可能性の向上、および生のパフォーマンスの点で利点を示しています。
我々は、ローレンツブーストされたトップクォークのタグ付け(分類)と再構築(回帰)の両方の文脈におけるPELICANアルゴリズムアーキテクチャの包括的な研究を紹介します。これには、高密度環境内の$W$粒子を特異的に特定して測定するという困難なタスクが含まれます。
ローレンツブーストされたトップクォークのハドロン最終状態。
また、PELICAN の応用を、クォーク開始ジェ​​ットとグルーオン開始ジェットを識別するタスク、および 5 つの異なるターゲット カテゴリにわたるジェットのマルチクラス識別に拡張します。
ローレンツブーストトップクォークタグ付けの標準タスクでテストした場合、PELICAN は、モデルの複雑さがはるかに低く、サンプル効率が高いため、既存の競合製品よりも優れたパフォーマンスを発揮します。
4 運動量回帰というあまり一般的ではない、より複雑なタスクでも、PELICAN は機械学習ではない手作りのアルゴリズムよりも優れたパフォーマンスを発揮します。
物理学における機械学習のより広範な分野における対称制限アーキテクチャの影響について議論します。

要約(オリジナル)

PELICAN is a novel permutation equivariant and Lorentz invariant or covariant aggregator network designed to overcome common limitations found in architectures applied to particle physics problems. Compared to many approaches that use non-specialized architectures that neglect underlying physics principles and require very large numbers of parameters, PELICAN employs a fundamentally symmetry group-based architecture that demonstrates benefits in terms of reduced complexity, increased interpretability, and raw performance. We present a comprehensive study of the PELICAN algorithm architecture in the context of both tagging (classification) and reconstructing (regression) Lorentz-boosted top quarks, including the difficult task of specifically identifying and measuring the $W$-boson inside the dense environment of the Lorentz-boosted top-quark hadronic final state. We also extend the application of PELICAN to the tasks of identifying quark-initiated vs.~gluon-initiated jets, and a multi-class identification across five separate target categories of jets. When tested on the standard task of Lorentz-boosted top-quark tagging, PELICAN outperforms existing competitors with much lower model complexity and high sample efficiency. On the less common and more complex task of 4-momentum regression, PELICAN also outperforms hand-crafted, non-machine learning algorithms. We discuss the implications of symmetry-restricted architectures for the wider field of machine learning for physics.

arxiv情報

著者 Alexander Bogatskiy,Timothy Hoffman,David W. Miller,Jan T. Offermann,Xiaoyang Liu
発行日 2023-10-13 16:09:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, hep-ex, hep-ph パーマリンク