Fast 2D Bicephalous Convolutional Autoencoder for Compressing 3D Time Projection Chamber Data


高エネルギー大型粒子衝突器は、核物理学では毎秒 1 テラバイト、高エネルギー物理学では毎秒ペタバイトのオーダーの高速データを生成します。
このようなデータを高スループットで削減して永続的なストレージに適合させるリアルタイム データ圧縮アルゴリズムの開発がますます注目を集めています。
具体的には、相対論的重イオン衝突型加速器 (RHIC) に新しく構築された sPHENIX 実験では、時間投影チャンバーが主追跡検出器として使用され、3 次元 (3D) 円柱のボリューム内の粒子の軌道を記録します。
結果として得られるデータは通常、占有率が約 10.8% と非常にまばらです。
このようなスパース性は、SZ、ZFP、MGARD などの従来の学習不要の非可逆圧縮アルゴリズムに課題をもたらします。
3D 畳み込みニューラル ネットワーク (CNN) ベースのアプローチである二頭筋畳み込みオートエンコーダー (BCAE) は、圧縮率と再構成精度の両方で従来の方法よりも優れています。
BCAE は、最新の異機種混合高性能コンピューティング環境での展開に適したグラフィック処理ユニットの計算能力を利用することもできます。
この研究では、BCAE++ と BCAE-2D という 2 つの BCAE バリアントが導入されています。
BCAE++ は、BCAE と比較して、平均絶対誤差で測定した圧縮率が 15% 向上し、再構成精度が 77% 向上しました。
BCAE-2D は、半径方向を画像のチャネル次元として扱うため、圧縮スループットが 3 倍高速化されます。
さらに、より大きなデコーダを備えたアンバランス オートエンコーダにより、スループットを大幅に犠牲にすることなく再構成精度を向上できることを実証します。
最後に、BCAE++ と BCAE-2D の両方が、再構成精度を損なうことなく、半精度モードを使用するとスループット (76 ~ 79% の向上) でより多くのメリットが得られることがわかりました。
ソース コードと、データと事前トレーニングされたモデルへのリンクは、 にあります。


High-energy large-scale particle colliders produce data at high speed in the order of 1 terabytes per second in nuclear physics and petabytes per second in high-energy physics. Developing real-time data compression algorithms to reduce such data at high throughput to fit permanent storage has drawn increasing attention. Specifically, at the newly constructed sPHENIX experiment at the Relativistic Heavy Ion Collider (RHIC), a time projection chamber is used as the main tracking detector, which records particle trajectories in a volume of a three-dimensional (3D) cylinder. The resulting data are usually very sparse with occupancy around 10.8%. Such sparsity presents a challenge to conventional learning-free lossy compression algorithms, such as SZ, ZFP, and MGARD. The 3D convolutional neural network (CNN)-based approach, Bicephalous Convolutional Autoencoder (BCAE), outperforms traditional methods both in compression rate and reconstruction accuracy. BCAE can also utilize the computation power of graphical processing units suitable for deployment in a modern heterogeneous high-performance computing environment. This work introduces two BCAE variants: BCAE++ and BCAE-2D. BCAE++ achieves a 15% better compression ratio and a 77% better reconstruction accuracy measured in mean absolute error compared with BCAE. BCAE-2D treats the radial direction as the channel dimension of an image, resulting in a 3x speedup in compression throughput. In addition, we demonstrate an unbalanced autoencoder with a larger decoder can improve reconstruction accuracy without significantly sacrificing throughput. Lastly, we observe both the BCAE++ and BCAE-2D can benefit more from using half-precision mode in throughput (76-79% increase) without loss in reconstruction accuracy. The source code and links to data and pretrained models can be found at


著者 Yi Huang,Yihui Ren,Shinjae Yoo,Jin Huang
発行日 2023-10-23 15:23:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.LG, hep-ex, stat.ML パーマリンク