要約
Functional Isolation Forest (FIF)は、機能データ用に設計された最新の異常検出(AD)アルゴリズムである。FIFは、線形内積を通して描画された辞書に各曲線観察を投影することにより異常スコアを計算する、ツリー分割手順に依存する。このような線形内積と辞書は、アルゴリズムの性能に大きく影響する先験的な選択であり、特に複雑なデータセットでは信頼できない結果につながる可能性がある。本研究では、ラフパス理論のシグネチャ変換を活用した新しいADアルゴリズムクラスである「シグネチャ分離フォレスト(Signature Isolation Forest)」を導入することで、これらの課題に対処する。我々の目的は、特にFIF内積の線形性と辞書の選択をターゲットとした2つのアルゴリズムの提案を通じて、FIFによって課される制約を取り除くことである。我々の手法の妥当性を示す実世界応用ベンチマークを含むいくつかの数値実験を提供する。
要約(オリジナル)
Functional Isolation Forest (FIF) is a recent state-of-the-art Anomaly Detection (AD) algorithm designed for functional data. It relies on a tree partition procedure where an abnormality score is computed by projecting each curve observation on a drawn dictionary through a linear inner product. Such linear inner product and the dictionary are a priori choices that highly influence the algorithm’s performances and might lead to unreliable results, particularly with complex datasets. This work addresses these challenges by introducing \textit{Signature Isolation Forest}, a novel AD algorithm class leveraging the rough path theory’s signature transform. Our objective is to remove the constraints imposed by FIF through the proposition of two algorithms which specifically target the linearity of the FIF inner product and the choice of the dictionary. We provide several numerical experiments, including a real-world applications benchmark showing the relevance of our methods.
arxiv情報
著者 | Marta Campi,Guillaume Staerman,Gareth W. Peters,Tomoko Matsui |
発行日 | 2024-10-03 17:05:49+00:00 |
arxivサイト | arxiv_id(pdf) |