Automated Machine Learning in Insurance

要約

機械学習 (ML) は、保険数理研究や保険産業への応用で人気を集めています。
ただし、ほとんどの ML タスクのパフォーマンスは、データの前処理、モデルの選択、ハイパーパラメーターの最適化に大きく依存しており、これらはドメインの知識、経験、手作業の点で多大な労力を要すると考えられています。
Automated Machine Learning (AutoML) は、ML タスクのライフサイクル全体を自動的に完了することを目的としており、人間の介入や監督なしで最先端の ML モデルを提供します。
このペーパーでは、ドメインの知識や経験のないユーザーでも、わずか数行のコードを記述するだけで堅牢かつ楽な ML 導入を実現できる AutoML ワークフローを紹介します。
この提案された AutoML は、データ前処理のバランシング ステップ、アンサンブル パイプライン、カスタマイズされた損失関数などの機能を備え、特に保険アプリケーション向けに調整されています。
これらの機能は、一般的な保険データセットの不均衡な性質など、保険ドメイン特有の課題に対処するように設計されています。
完全なコードとドキュメントは GitHub リポジトリで入手できます。
(https://github.com/PanyiDong/InsurAutoML)

要約(オリジナル)

Machine Learning (ML) has gained popularity in actuarial research and insurance industrial applications. However, the performance of most ML tasks heavily depends on data preprocessing, model selection, and hyperparameter optimization, which are considered to be intensive in terms of domain knowledge, experience, and manual labor. Automated Machine Learning (AutoML) aims to automatically complete the full life-cycle of ML tasks and provides state-of-the-art ML models without human intervention or supervision. This paper introduces an AutoML workflow that allows users without domain knowledge or prior experience to achieve robust and effortless ML deployment by writing only a few lines of code. This proposed AutoML is specifically tailored for the insurance application, with features like the balancing step in data preprocessing, ensemble pipelines, and customized loss functions. These features are designed to address the unique challenges of the insurance domain, including the imbalanced nature of common insurance datasets. The full code and documentation are available on the GitHub repository. (https://github.com/PanyiDong/InsurAutoML)

arxiv情報

著者 Panyi Dong,Zhiyu Quan
発行日 2024-08-26 14:55:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク