A Structured Reasoning Framework for Unbalanced Data Classification Using Probabilistic Models

要約

このペーパーでは、不均衡なバイアスの問題と不均一なクラス分布のある環境での従来の機械学習モデルの少数派クラス認識能力の不十分な問題を解決することを目的とした、不均衡なデータのマルコフネットワークモデルを研究します。
共同確率分布と条件付き依存性を構築することにより、モデルはサンプルカテゴリのグローバルモデリングと推論最適化を実現できます。
この研究では、限界確率推定と加重損失最適化戦略を導入し、正則化の制約と構造化された推論方法を組み合わせて、モデルの一般化能力と堅牢性を効果的に改善しました。
実験段階では、実際のクレジットカード詐欺検出データセットが選択され、ロジスティック回帰、サポートベクターマシン、ランダムフォレスト、XGBoostなどのモデルと比較されました。
実験結果は、マルコフネットワークが加重精度、F1スコア、AUC-ROCなどのインジケーターでうまく機能し、従来の分類モデルを大幅に上回ることを示しており、不均衡なデータシナリオにおけるその強力な意思決定能力と適用性を示しています。
将来の研究は、効率的なモデルトレーニング、構造的最適化、および大規模な不均衡なデータ環境における深い学習統合に焦点を当て、金融リスク管理、医療診断、インテリジェントモニタリングなどの実際のアプリケーションでの幅広いアプリケーションを促進することができます。

要約(オリジナル)

This paper studies a Markov network model for unbalanced data, aiming to solve the problems of classification bias and insufficient minority class recognition ability of traditional machine learning models in environments with uneven class distribution. By constructing joint probability distribution and conditional dependency, the model can achieve global modeling and reasoning optimization of sample categories. The study introduced marginal probability estimation and weighted loss optimization strategies, combined with regularization constraints and structured reasoning methods, effectively improving the generalization ability and robustness of the model. In the experimental stage, a real credit card fraud detection dataset was selected and compared with models such as logistic regression, support vector machine, random forest and XGBoost. The experimental results show that the Markov network performs well in indicators such as weighted accuracy, F1 score, and AUC-ROC, significantly outperforming traditional classification models, demonstrating its strong decision-making ability and applicability in unbalanced data scenarios. Future research can focus on efficient model training, structural optimization, and deep learning integration in large-scale unbalanced data environments and promote its wide application in practical applications such as financial risk control, medical diagnosis, and intelligent monitoring.

arxiv情報

著者 Junliang Du,Shiyu Dou,Bohuan Yang,Jiacheng Hu,Tai An
発行日 2025-02-05 17:20:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク