A tree-based varying coefficient model

要約

この論文では、Delong らの巡回勾配ブースティング マシン (CGBM) を使用して変動係数がモデル化されるツリーベースの変動係数モデル (VCM) を紹介します。
(2023年)。
CGBM を使用して係数関数をモデル化すると、次元ごとの早期停止と特徴重要度スコアが可能になります。
次元ごとの早期停止により、次元固有の過学習のリスクが軽減されるだけでなく、次元間のモデルの複雑さの違いも明らかになります。
特徴重要度スコアを使用すると、簡単な特徴選択と簡単なモデル解釈が可能になります。
このモデルは、Richman と W\’uthrich (2023) で使用されたのと同じシミュレートされた実際のデータ例で評価され、その結果は、サンプル外損失の点でニューラル ネットワークの結果と同等の結果が得られることを示しています。
LocalGLMnet と呼ばれるベースの VCM。

要約(オリジナル)

The paper introduces a tree-based varying coefficient model (VCM) where the varying coefficients are modelled using the cyclic gradient boosting machine (CGBM) from Delong et al. (2023). Modelling the coefficient functions using a CGBM allows for dimension-wise early stopping and feature importance scores. The dimension-wise early stopping not only reduces the risk of dimension-specific overfitting, but also reveals differences in model complexity across dimensions. The use of feature importance scores allows for simple feature selection and easy model interpretation. The model is evaluated on the same simulated and real data examples as those used in Richman and W\’uthrich (2023), and the results show that it produces results in terms of out of sample loss that are comparable to those of their neural network-based VCM called LocalGLMnet.

arxiv情報

著者 Henning Zakrisson,Mathias Lindholm
発行日 2024-01-11 15:35:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク