要約
マーク付き時間点プロセス (MTPP) は、不規則な到着時間を持つさまざまな種類のイベントのシーケンスをモデル化するために使用され、医療やソーシャル ネットワークから金融に至るまで幅広い用途に使用されます。
私たちは、現代の深層状態空間モデル (SSM) と線形ホークス プロセス (LHP) の間の接続を描画することで、既存の点プロセス モデルの欠点に対処し、最終的に深層線形ホークス プロセス (DLHP) と呼ばれる MTPP に到達します。
DLHP は、ディープ SSM の線形微分方程式を変更して、LHP に似た確率的ジャンプ微分方程式を作成します。
離散化後、並列スキャンを使用して結果の再帰を効率的に実装できます。
これにより、MTPP モデルに並列処理と線形スケーリングがもたらされます。
これは、二次的にスケーリングするアテンションベースの MTPP や、シーケンス長全体にわたって並列化しない RNN ベースの MTPP とは対照的です。
私たちは、DLHP が 8 つの現実世界のデータセットの幅広いメトリクスにわたって既存のモデルと同等またはそれを上回るパフォーマンスを示すことを経験的に示しています。
私たちが提案する DLHP モデルは、新しいクラスの MTPP モデルを構築するために活用されている SSM の独自のアーキテクチャ機能の最初のインスタンスです。
要約(オリジナル)
Marked temporal point processes (MTPPs) are used to model sequences of different types of events with irregular arrival times, with broad applications ranging from healthcare and social networks to finance. We address shortcomings in existing point process models by drawing connections between modern deep state-space models (SSMs) and linear Hawkes processes (LHPs), culminating in an MTPP that we call the deep linear Hawkes process (DLHP). The DLHP modifies the linear differential equations in deep SSMs to be stochastic jump differential equations, akin to LHPs. After discretizing, the resulting recurrence can be implemented efficiently using a parallel scan. This brings parallelism and linear scaling to MTPP models. This contrasts with attention-based MTPPs, which scale quadratically, and RNN-based MTPPs, which do not parallelize across the sequence length. We show empirically that DLHPs match or outperform existing models across a broad range of metrics on eight real-world datasets. Our proposed DLHP model is the first instance of the unique architectural capabilities of SSMs being leveraged to construct a new class of MTPP models.
arxiv情報
著者 | Yuxin Chang,Alex Boyd,Cao Xiao,Taha Kass-Hout,Parminder Bhatia,Padhraic Smyth,Andrew Warrington |
発行日 | 2024-12-27 13:23:58+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google