Data-driven Discovery of Biophysical T Cell Receptor Co-specificity Rules

要約

T細胞受容体(TCR)とそのリガンドとの間の生物物理学的相互作用は、細胞免疫応答の特異性を決定します。
しかし、受容体とリガンドの膨大な多様性は、異なるリガンドによって作成された明確な結合親和性の風景全体で一般化可能なルールを発見することを困難にしました。
ここでは、TCRがリガンドに特異性を共有するかどうかを予測する生物物理学的ルールを発見するための最適化フレームワークを提示します。
SARS-COV-2ペプチドのコレクションに関連するTCRSにこのフレームワークを適用すると、Co特異性が受容体間のアミノ酸の違いのタイプと位置にどのように依存するかを体系的に特徴付けます。
また、推測された規則は、トレーニング中に見られるものと非常に類似しているリガンドに一般化することを実証します。
我々の分析では、置換されたアミノ酸間の立体特性の一致は、進化の代替性を顕著に決定する疎水性特性よりも、受容体のCo特異性赤の方が重要であることが明らかになりました。
また、分析は、特異性のためにペプチドと直接接触しない位置の実質的な重要性を定量化します。
これらの発見は、適応免疫応答の特異性を支える分子メカニズムを明らかにするデータ駆動型アプローチの可能性を強調しています。

要約(オリジナル)

The biophysical interactions between the T cell receptor (TCR) and its ligands determine the specificity of the cellular immune response. However, the immense diversity of receptors and ligands has made it challenging to discover generalizable rules across the distinct binding affinity landscapes created by different ligands. Here, we present an optimization framework for discovering biophysical rules that predict whether TCRs share specificity to a ligand. Applying this framework to TCRs associated with a collection of SARS-CoV-2 peptides we systematically characterize how co-specificity depends on the type and position of amino-acid differences between receptors. We also demonstrate that the inferred rules generalize to ligands highly dissimilar to any seen during training. Our analysis reveals that matching of steric properties between substituted amino acids is more important for receptor co-specificity red than the hydrophobic properties that prominently determine evolutionary substitutability. Our analysis also quantifies the substantial importance of positions not in direct contact with the peptide for specificity. These findings highlight the potential for data-driven approaches to uncover the molecular mechanisms underpinning the specificity of adaptive immune responses.

arxiv情報

著者 Andrew G. T. Pyo,Yuta Nagano,Martina Milighetti,James Henderson,Curtis G. Callan Jr.,Benny Chain,Ned S. Wingreen,Andreas Tiffeau-Mayer
発行日 2025-04-30 13:59:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, physics.bio-ph, q-bio.BM | Data-driven Discovery of Biophysical T Cell Receptor Co-specificity Rules はコメントを受け付けていません

ForceGrip: Reference-Free Curriculum Learning for Realistic Grip Force Control in VR Hand Manipulation

要約

現実的なハンドマニピュレーションは、没入型仮想現実(VR)の重要なコンポーネントですが、既存の方法は、接触力や指のトルクなどの重要な物理的属性を省略する運動学的アプローチまたはモーションキャプチャデータセットに依存することがよくあります。
その結果、これらのアプローチは、ユーザーの意図した力レベルを反映するのではなく、タイトでワンサイズに適合するグリップを優先します。
私たちは、ユーザーのグリップ力の意図を忠実に反映して、現実的な手操作の動きを統合する深い学習エージェントであるForceGripを提示します。
事前定義されたモーションデータセットを模倣する代わりに、ForceGripは、生成されたトレーニングシナリオを使用して、オブジェクトの形状、手首の動き、および入力フローをトリガーして、幅広い物理的相互作用でエージェントに挑戦します。
これらの複雑なタスクから効果的に学ぶために、指の位置付け、意図適応、および動的安定化を含む3フェーズカリキュラム学習フレームワークを採用しています。
このプログレッシブ戦略により、安定した手観オブジェクトの接触、ユーザー入力に基づいた適応力制御、動的条件下での堅牢な処理が保証されます。
さらに、近接報酬関数は自然な指の動きを強化し、トレーニングの収束を加速します。
定量的および定性的評価により、最先端の方法と比較して、forcegripの優れた力の制御性と妥当性が明らかになります。
デモビデオは補足資料として入手でき、コードはhttps://han-dongheun.github.io/forcegripで提供されています。

要約(オリジナル)

Realistic Hand manipulation is a key component of immersive virtual reality (VR), yet existing methods often rely on kinematic approach or motion-capture datasets that omit crucial physical attributes such as contact forces and finger torques. Consequently, these approaches prioritize tight, one-size-fits-all grips rather than reflecting users’ intended force levels. We present ForceGrip, a deep learning agent that synthesizes realistic hand manipulation motions, faithfully reflecting the user’s grip force intention. Instead of mimicking predefined motion datasets, ForceGrip uses generated training scenarios-randomizing object shapes, wrist movements, and trigger input flows-to challenge the agent with a broad spectrum of physical interactions. To effectively learn from these complex tasks, we employ a three-phase curriculum learning framework comprising Finger Positioning, Intention Adaptation, and Dynamic Stabilization. This progressive strategy ensures stable hand-object contact, adaptive force control based on user inputs, and robust handling under dynamic conditions. Additionally, a proximity reward function enhances natural finger motions and accelerates training convergence. Quantitative and qualitative evaluations reveal ForceGrip’s superior force controllability and plausibility compared to state-of-the-art methods. Demo videos are available as supplementary material and the code is provided at https://han-dongheun.github.io/ForceGrip.

arxiv情報

著者 DongHeun Han,Byungmin Kim,RoUn Lee,KyeongMin Kim,Hyoseok Hwang,HyeongYeop Kang
発行日 2025-04-30 14:03:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.GR, cs.HC, cs.LG, cs.RO | ForceGrip: Reference-Free Curriculum Learning for Realistic Grip Force Control in VR Hand Manipulation はコメントを受け付けていません

On Advancements of the Forward-Forward Algorithm

要約

将来のアルゴリズムは、機械学習研究で進化し、実際のアプリケーションを模倣するより複雑なタスクに取り組んでいます。
過去数年間、元のバージョンよりも優れたパフォーマンスを発揮するためのいくつかの手法によって改善され、柔軟性と低いメモリの使用量を失うことなく、CIFAR10のような挑戦的なデータセットを処理しました。
結果では、テストエラーの割合が20 \%減少するトレーニング中に、畳み込みチャネルのグループ化、学習レートスケジュール、および独立したブロック構造の組み合わせによって改善が達成されることを示しました。
さらに、低容量ハードウェアプロジェクトのさらなる実装にアプローチするために、164,706から754,386の間に(21 $ \ PM $ 6)\%内(21 $ \ pm $ 6)\%内で低いテストエラー率を達成する一連の軽量モデルを提示しました。
これは、これらの種類のニューラルネットワークの完全な検証と検証に関する将来の研究の基礎としても機能します。

要約(オリジナル)

The Forward-Forward algorithm has evolved in machine learning research, tackling more complex tasks that mimic real-life applications. In the last years, it has been improved by several techniques to perform better than its original version, handling a challenging dataset like CIFAR10 without losing its flexibility and low memory usage. We have shown in our results that improvements are achieved through a combination of convolutional channel grouping, learning rate schedules, and independent block structures during training that lead to a 20\% decrease in test error percentage. Additionally, to approach further implementations on low-capacity hardware projects we have presented a series of lighter models that achieve low test error percentages within (21$\pm$6)\% and number of trainable parameters between 164,706 and 754,386. This serving also as a basis for our future study on complete verification and validation of these kinds of neural networks.

arxiv情報

著者 Mauricio Ortiz Torres,Markus Lange,Arne P. Raulf
発行日 2025-04-30 14:03:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | On Advancements of the Forward-Forward Algorithm はコメントを受け付けていません

Traceback of Poisoning Attacks to Retrieval-Augmented Generation

要約

検索された生成(RAG)システムと統合された大規模な言語モデル(LLM)は、外部の知識ソースを活用することにより精度を向上させます。
しかし、最近の研究により、Ragの中毒攻撃に対する感受性が明らかになりました。攻撃者が毒物を知識データベースに注入し、攻撃者を決定した応答につながりました。
主に推論時間緩和に焦点を当てた既存の防御は、洗練された攻撃に対して不十分であることが証明されています。
このホワイトペーパーでは、攻撃を担当する知識データベース内で中毒テキストを識別するように設計されたRagの最初のトレースバックシステムであるRagforensicsを紹介します。
Ragforensicsは繰り返し動作し、最初にデータベースからテキストのサブセットを取得し、次に潜在的な中毒テキストの検出にLLMを導くために特別に作成されたプロンプトを使用します。
複数のデータセットにわたる経験的評価は、最先端の中毒攻撃に対するRagforensicsの有効性を示しています。
この作業は、RAGシステムの中毒テキストの痕跡を先駆けて、セキュリティを強化するための実用的で有望な防御メカニズムを提供します。

要約(オリジナル)

Large language models (LLMs) integrated with retrieval-augmented generation (RAG) systems improve accuracy by leveraging external knowledge sources. However, recent research has revealed RAG’s susceptibility to poisoning attacks, where the attacker injects poisoned texts into the knowledge database, leading to attacker-desired responses. Existing defenses, which predominantly focus on inference-time mitigation, have proven insufficient against sophisticated attacks. In this paper, we introduce RAGForensics, the first traceback system for RAG, designed to identify poisoned texts within the knowledge database that are responsible for the attacks. RAGForensics operates iteratively, first retrieving a subset of texts from the database and then utilizing a specially crafted prompt to guide an LLM in detecting potential poisoning texts. Empirical evaluations across multiple datasets demonstrate the effectiveness of RAGForensics against state-of-the-art poisoning attacks. This work pioneers the traceback of poisoned texts in RAG systems, providing a practical and promising defense mechanism to enhance their security.

arxiv情報

著者 Baolei Zhang,Haoran Xin,Minghong Fang,Zhuqing Liu,Biao Yi,Tong Li,Zheli Liu
発行日 2025-04-30 14:10:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CR, cs.IR, cs.LG | Traceback of Poisoning Attacks to Retrieval-Augmented Generation はコメントを受け付けていません

A Formal Framework for Understanding Length Generalization in Transformers

要約

トランスの主要な課題は、トレーニング中に観察されたものよりも長くシーケンスに一般化することです。
以前の作品は、トランスがタスクに応じて成功または長さの一般化を成功させるか失敗させることができることを経験的に示していますが、この現象の理論的理解は限られたままです。
この作業では、学習可能な絶対位置エンコーディングを備えた因果変圧器の長さの一般化を分析するための厳しい理論的枠組みを紹介します。
特に、ノルムベースの正規者を使用した理想化された推論スキームの下で絶対的な位置エンコーディングを使用して、十分に長い入力から制限で識別できる機能を特徴付けます。
これにより、問題の豊富な家族の長さの一般化の可能性を証明することができます。
私たちは、さまざまなアルゴリズムおよび正式な言語タスクにわたる長さの一般化の成功と失敗の予測因子として理論を実験的に検証します。
私たちの理論は、経験的観察の広範なセットを説明するだけでなく、変圧器の長さの一般化能力を実証する方法も開きます。

要約(オリジナル)

A major challenge for transformers is generalizing to sequences longer than those observed during training. While previous works have empirically shown that transformers can either succeed or fail at length generalization depending on the task, theoretical understanding of this phenomenon remains limited. In this work, we introduce a rigorous theoretical framework to analyze length generalization in causal transformers with learnable absolute positional encodings. In particular, we characterize those functions that are identifiable in the limit from sufficiently long inputs with absolute positional encodings under an idealized inference scheme using a norm-based regularizer. This enables us to prove the possibility of length generalization for a rich family of problems. We experimentally validate the theory as a predictor of success and failure of length generalization across a range of algorithmic and formal language tasks. Our theory not only explains a broad set of empirical observations but also opens the way to provably predicting length generalization capabilities in transformers.

arxiv情報

著者 Xinting Huang,Andy Yang,Satwik Bhattamishra,Yash Sarrof,Andreas Krebs,Hattie Zhou,Preetum Nakkiran,Michael Hahn
発行日 2025-04-30 15:01:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | A Formal Framework for Understanding Length Generalization in Transformers はコメントを受け付けていません

Gaussian process surrogate model to approximate power grid simulators — An application to the certification of a congestion management controller

要約

電源グリッドのデジタル化により、物理方程式はネットワークの動作を記述するのに不十分になり、現実的だが時間のかかるシミュレーターを使用する必要があります。
安全検証などの数値実験は、多数のシナリオをシミュレートすることを含むことを含むようになります。
計算負担を減らすための一般的なソリューションは、機械学習(ML)を使用してシミュレーターの代理モデルを学習し、高速から評価する代理モデルで実験を直接実行することです。
代理モデルを構築するためのさまざまなMLの可能性の中で、ガウスプロセス(GPS)は、柔軟性、データ効率、および解釈可能性のために一般的なソリューションとして登場しました。
彼らの確率論的性質により、予測と不確実性の定量化(UQ)の両方を提供することができます。
このペーパーは、GPSを使用して電源グリッドシミュレータを近似し、数値実験を固定することに関心があることに関する議論から始まります。
ただし、このようなシミュレーターは、GPの根底にあるガウスの仮定にしばしば違反し、近似が不十分です。
この制限に対処するために、UQに適応的な残留不確実性の用語を追加することで構成されるアプローチが提案されています。
これにより、シミュレーターの非ガウス行動にもかかわらず、GPは正確で信頼性を維持できます。
このアプローチは、輻輳管理コントローラーの適切な機能の認証に正常に適用され、シミュレーションの98%以上が回避されます。

要約(オリジナル)

With the digitalization of power grids, physical equations become insufficient to describe the network’s behavior, and realistic but time-consuming simulators must be used. Numerical experiments, such as safety validation, that involve simulating a large number of scenarios become computationally intractable. A popular solution to reduce the computational burden is to learn a surrogate model of the simulator with Machine Learning (ML) and then conduct the experiment directly on the fast-to-evaluate surrogate model. Among the various ML possibilities for building surrogate models, Gaussian processes (GPs) emerged as a popular solution due to their flexibility, data efficiency, and interpretability. Their probabilistic nature enables them to provide both predictions and uncertainty quantification (UQ). This paper starts with a discussion on the interest of using GPs to approximate power grid simulators and fasten numerical experiments. Such simulators, however, often violate the GP’s underlying Gaussian assumption, leading to poor approximations. To address this limitation, an approach that consists in adding an adaptive residual uncertainty term to the UQ is proposed. It enables the GP to remain accurate and reliable despite the simulator’s non-Gaussian behaviors. This approach is successfully applied to the certification of the proper functioning of a congestion management controller, with over 98% of simulations avoided.

arxiv情報

著者 Pierre Houdouin,Lucas Saludjian
発行日 2025-04-30 15:29:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Gaussian process surrogate model to approximate power grid simulators — An application to the certification of a congestion management controller はコメントを受け付けていません

Estimation of discrete distributions in relative entropy, and the deviations of the missing mass

要約

I.I.D.からの有限アルファベット上の分布を推定する問題を研究しています。
サンプル。相対エントロピー(Kullback-Leibler発散)で測定された精度を備えたサンプル。
最適な予想されるリスク境界は知られていますが、高度な保証はまだ理解されていません。
まず、古典的なラプラス(追加$ 1 $)推定器を分析し、そのパフォーマンスで一致する上限と下限を取得し、信頼非依存の推定器間でその最適性を示します。
次に、単純な信頼依存スムージング技術を介して達成される推定器が達成できる最新の最適性の高い高度性リスクを特徴付けます。
興味深いことに、最適な非症状のリスクには、理想的な漸近リスクに対する追加の対数因子が含まれています。
次に、アルファベットがサンプルサイズを超えるシナリオに動機付けられているため、手元の分布のスパース性に適応する方法を調査します。
データ依存性のスムージングを使用して推定器を導入します。このスムージングは​​、2つの効果的なスパース性パラメーターに応じて、縛られた高度のリスクを確立します。
分析の一環として、不足している質量の鋭い高速性の上限も導き出します。

要約(オリジナル)

We study the problem of estimating a distribution over a finite alphabet from an i.i.d. sample, with accuracy measured in relative entropy (Kullback-Leibler divergence). While optimal expected risk bounds are known, high-probability guarantees remain less well-understood. First, we analyze the classical Laplace (add-$1$) estimator, obtaining matching upper and lower bounds on its performance and showing its optimality among confidence-independent estimators. We then characterize the minimax-optimal high-probability risk achievable by any estimator, which is attained via a simple confidence-dependent smoothing technique. Interestingly, the optimal non-asymptotic risk contains an additional logarithmic factor over the ideal asymptotic risk. Next, motivated by scenarios where the alphabet exceeds the sample size, we investigate methods that adapt to the sparsity of the distribution at hand. We introduce an estimator using data-dependent smoothing, for which we establish a high-probability risk bound depending on two effective sparsity parameters. As part of the analysis, we also derive a sharp high-probability upper bound on the missing mass.

arxiv情報

著者 Jaouad Mourtada
発行日 2025-04-30 16:47:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.IT, cs.LG, math.IT, math.ST, stat.ML, stat.TH | Estimation of discrete distributions in relative entropy, and the deviations of the missing mass はコメントを受け付けていません

Balancing Interpretability and Flexibility in Modeling Diagnostic Trajectories with an Embedded Neural Hawkes Process Model

要約

ホークスプロセス(HP)は、一般に、電子健康記録(EHR)を含む自己強化ダイナミクスを備えたイベントシーケンスをモデル化するために使用されます。
従来のHPSは、各イベントが他のイベントの強度をどのように調節するかを理解するために検査できるパラメトリックインパクト関数を介して自己強化をキャプチャします。
ニューラルネットワークベースのHPSは柔軟性を高め、適合性と予測のパフォーマンスが向上しますが、解釈可能性を犠牲にして、これはしばしばヘルスケアで重要です。
この作業では、このトレードオフを理解し、改善することを目指しています。
衝撃関数が、多くのイベントタイプの大規模なイベントシーケンスをモデル化できるイベントスペースを埋め込むイベントスペースでインスタンス化された柔軟な衝撃カーネルを定義することによってモデル化される新しいHP定式化を提案します。
このアプローチは、従来のHPSよりも柔軟性があり、他のニューラルネットワークアプローチよりも解釈可能であり、トランスエンコーダーレイヤーを追加してイベントの埋め込みをさらにコンテキスト化することにより、解釈性の柔軟性を明示的に交換できます。
結果は、この方法がシミュレーションでインパクト関数を正確に回復し、模倣IVプロシージャデータセットで競争力のあるパフォーマンスを達成し、変圧器層がなくても子供診断データセットを使用してXX-EHRで臨床的に意味のある解釈を獲得することを示しています。
これは、EHRや他のデータで自己強化ダイナミクスを効果的にキャプチャするのに柔軟な影響カーネルがしばしば十分であり、パフォーマンスを失うことなく解釈可能性を維持できることを意味することを示唆しています。

要約(オリジナル)

The Hawkes process (HP) is commonly used to model event sequences with self-reinforcing dynamics, including electronic health records (EHRs). Traditional HPs capture self-reinforcement via parametric impact functions that can be inspected to understand how each event modulates the intensity of others. Neural network-based HPs offer greater flexibility, resulting in improved fit and prediction performance, but at the cost of interpretability, which is often critical in healthcare. In this work, we aim to understand and improve upon this tradeoff. We propose a novel HP formulation in which impact functions are modeled by defining a flexible impact kernel, instantiated as a neural network, in event embedding space, which allows us to model large-scale event sequences with many event types. This approach is more flexible than traditional HPs yet more interpretable than other neural network approaches, and allows us to explicitly trade flexibility for interpretability by adding transformer encoder layers to further contextualize the event embeddings. Results show that our method accurately recovers impact functions in simulations, achieves competitive performance on MIMIC-IV procedure dataset, and gains clinically meaningful interpretation on XX-EHR with children diagnosis dataset even without transformer layers. This suggests that our flexible impact kernel is often sufficient to capture self-reinforcing dynamics in EHRs and other data effectively, implying that interpretability can be maintained without loss of performance.

arxiv情報

著者 Yuankang Zhao,Matthew Engelhard
発行日 2025-04-30 16:52:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.AP, stat.ML | Balancing Interpretability and Flexibility in Modeling Diagnostic Trajectories with an Embedded Neural Hawkes Process Model はコメントを受け付けていません

Stable Trajectory Clustering: An Efficient Split and Merge Algorithm

要約

クラスタリングアルゴリズムは、パターンを識別するための特性によってグループデータポイントをグループ化します。
過去20年にわたって、研究者はこれらの方法を拡張して、人間、動物、車両の軌跡を分析し、アプリケーション全体の行動と動きを研究してきました。
このホワイトペーパーでは、DBSCANラインセグメントクラスタリングに基づいた全軌道クラスタリングおよびサブトルスターのクラスタリングアルゴリズムを紹介します。これには、ラインセグメントの分割とマージという2つの重要なイベントが含まれます。
イベントは、オブジェクトの動きの履歴とラインセグメント間の平均ユークリッド距離によって採用されています。
このフレームワークでは、全軌道クラスタリングはエンティティ全体の軌跡を考慮しますが、サブトラジェクタークラスタリングはスライディングウィンドウモデルを採用して同様のサブトリューションを識別します。
多くの既存の軌跡クラスタリングアルゴリズムは、軌跡を分割することによりデータの一時的な異常に応答します。これは、しばしば一貫したクラスタリングパターンを曖昧にし、信頼性の低い洞察につながります。
安定した軌道クラスタリングアルゴリズムを導入します。これは、平均絶対偏差概念を活用して、一時的な偏差の選択的省略がクラスターの完全性を維持するだけでなく、安定性と解釈性を向上させることを実証します。
パラメーターのバリエーションに対する有効性と感度を示すために、実際の軌跡データセットで提案されたすべてのアルゴリズムを実行します。

要約(オリジナル)

Clustering algorithms group data points by characteristics to identify patterns. Over the past two decades, researchers have extended these methods to analyze trajectories of humans, animals, and vehicles, studying their behavior and movement across applications. This paper presents whole-trajectory clustering and sub-trajectory clustering algorithms based on DBSCAN line segment clustering, which encompasses two key events: split and merge of line segments. The events are employed by object movement history and the average Euclidean distance between line segments. In this framework, whole-trajectory clustering considers entire entities’ trajectories, whereas sub-trajectory clustering employs a sliding window model to identify similar sub-trajectories. Many existing trajectory clustering algorithms respond to temporary anomalies in data by splitting trajectories, which often obscures otherwise consistent clustering patterns and leads to less reliable insights. We introduce the stable trajectory clustering algorithm, which leverages the mean absolute deviation concept to demonstrate that selective omission of transient deviations not only preserves the integrity of clusters but also improves their stability and interpretability. We run all proposed algorithms on real trajectory datasets to illustrate their effectiveness and sensitivity to parameter variations.

arxiv情報

著者 Atieh Rahmani,Mansoor Davoodi,Justin M. Calabrese
発行日 2025-04-30 17:11:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CG, cs.LG | Stable Trajectory Clustering: An Efficient Split and Merge Algorithm はコメントを受け付けていません

Scalable Multi-Task Learning for Particle Collision Event Reconstruction with Heterogeneous Graph Neural Networks

要約

大規模なハドロンコリダーでの輝度フロンティアの成長は、粒子衝突イベントの再構築と分析に挑戦しています。
粒子の多様性の増加は、データ収集段階での潜在的なレイテンシとストレージ要件の緊張と貯蔵要件を負っていますが、より高いバックグラウンドレベルやより頻繁な粒子頂点の誤解など、新しい合併症が現れています。
これにより、機械学習における最近の進歩を活用する、より全体的でスケーラブルな再構築方法の開発が必要です。
多様な粒子衝突関係のためのユニークな表現と、スケーラビリティのための統合グラフ剪定層を特徴とする新しい異種グラフニューラルネットワーク(HGNN)アーキテクチャを提案します。
LHCB実験を模倣した環境でマルチタスクパラダイムで訓練されたこのHGNNは、ハドロンの再構成パフォーマンスを大幅に改善します。
特に、単一のフレームワーク内で粒子頂点関連とグラフ剪定を同時に実行します。
再構築と剪定のパフォーマンスを定量化し、イベントの複雑さによる推論時間スケーリングの強化を示し、加重メッセージの合格スキームを使用して潜在的なパフォーマンス損失を軽減します。

要約(オリジナル)

The growing luminosity frontier at the Large Hadron Collider is challenging the reconstruction and analysis of particle collision events. Increased particle multiplicities are straining latency and storage requirements at the data acquisition stage, while new complications are emerging, including higher background levels and more frequent particle vertex misassociations. This in turn necessitates the development of more holistic and scalable reconstruction methods that take advantage of recent advances in machine learning. We propose a novel Heterogeneous Graph Neural Network (HGNN) architecture featuring unique representations for diverse particle collision relationships and integrated graph pruning layers for scalability. Trained with a multi-task paradigm in an environment mimicking the LHCb experiment, this HGNN significantly improves beauty hadron reconstruction performance. Notably, it concurrently performs particle vertex association and graph pruning within a single framework. We quantify reconstruction and pruning performance, demonstrate enhanced inference time scaling with event complexity, and mitigate potential performance loss using a weighted message passing scheme.

arxiv情報

著者 William Sutcliffe,Marta Calvi,Simone Capelli,Jonas Eschle,Julián García Pardiñas,Abhijit Mathad,Azusa Uzuki,Nicola Serra
発行日 2025-04-30 17:53:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, hep-ex, physics.data-an | Scalable Multi-Task Learning for Particle Collision Event Reconstruction with Heterogeneous Graph Neural Networks はコメントを受け付けていません