Multicollinearity Resolution Based on Machine Learning: A Case Study of Carbon Emissions


この研究では、炭素排出問題などの構造の複雑さと多重共線性の問題を伴う多要素問題に対処するために、DBSCAN クラスタリングとペナルティ付き回帰モデルを使用した一般的な分析フレームワークを紹介します。
このフレームワークは、機能を客観的にクラスター化する教師なし学習に DBSCAN を活用します。
このフレームワークを適用して 2000 年から 2019 年までの 46 業界のエネルギー消費データを分析すると、中国のサンプルで 16 のカテゴリーが特定されました。


This study presents a general analytical framework using DBSCAN clustering and penalized regression models to address multifactor problems with structural complexity and multicollinearity issues, such as carbon emission issue. The framework leverages DBSCAN for unsupervised learning to objectively cluster features. Meanwhile, penalized regression considers model complexity control and high dimensional feature selection to identify dominant influencing factors. Applying this framework to analyze energy consumption data for 46 industries from 2000 to 2019 identified 16 categories in the sample of China. We quantitatively assessed emission characteristics and drivers for each. The results demonstrate the framework’s analytical approach can identify primary emission sources by category, providing quantitative references for decision-making. Overall, this framework can evaluate complex regional issues like carbon emissions to support policymaking. This research preliminarily validated its application value in identifying opportunities for emission reduction worldwide.


著者 Xuanming Zhang,Xiaoxue Wang,Yonghang Chen
発行日 2025-01-02 14:59:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.LG パーマリンク