要約
生命保険は、他の形態の保険と同様に、大量のデータに大きく依存しています。
このビジネスモデルは、企業が事故の際に補償を提供する約束と引き換えに支払いを受け取る交換に基づいています。
したがって、データベースに保存されているデータの完全性に対する信頼が非常に重要です。
データの信頼性を確保する方法の 1 つは、異常の自動検出です。
このアプローチは非常に便利ですが、通常と異常な契約または相互作用を区別するラベル付きデータが不足しているため、困難でもあります。
この原稿では、いくつかの古典的および最新の教師なし異常検出方法について説明し、2 つの異なるデータセット間でそれらのパフォーマンスを比較します。
企業によるこれらの手法の導入を促進するために、この研究ではプロセスを自動化し、データ サイエンティスト以外の人でもアクセスできるようにする方法も検討しています。
要約(オリジナル)
Life insurance, like other forms of insurance, relies heavily on large volumes of data. The business model is based on an exchange where companies receive payments in return for the promise to provide coverage in case of an accident. Thus, trust in the integrity of the data stored in databases is crucial. One method to ensure data reliability is the automatic detection of anomalies. While this approach is highly useful, it is also challenging due to the scarcity of labeled data that distinguish between normal and anomalous contracts or inter\-actions. This manuscript discusses several classical and modern unsupervised anomaly detection methods and compares their performance across two different datasets. In order to facilitate the adoption of these methods by companies, this work also explores ways to automate the process, making it accessible even to non-data scientists.
arxiv情報
著者 | Andreas Groll,Akshat Khanna,Leonid Zeldin |
発行日 | 2024-11-26 15:06:12+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google