Discretizing Numerical Attributes: An Analysis of Human Perceptions


機械学習 (ML) では、数値属性を間隔に分割するためにさまざまな離散化手法が採用されています。
ただし、相関ルール マイニングなどの多くの ML アプリケーションでは、効果的な離散化手法が依然として見つかりません。
この研究は、数値属性分割のベンチマーク アプローチを確立することを目的としています。
私たちは、数値属性の分割に対する人間の認識を広範に分析し、これらの認識を提案した 2 つの尺度から得られた結果と比較します。
また、数値データ視覚化手法を使用して、データ サイエンス、統計、エンジニアリングの専門家の認識を調査します。
収集された回答の分析により、人間の回答の $68.7\%$ が、提案された測定値によって生成された値とほぼ一致していることが明らかになりました。
これらの結果に基づいて、私たちが提案する尺度は、数値属性を離散化するための方法の 1 つとして使用できる可能性があります。


Machine learning (ML) has employed various discretization methods to partition numerical attributes into intervals. However, an effective discretization technique remains elusive in many ML applications, such as association rule mining. Moreover, the existing discretization techniques do not reflect best the impact of the independent numerical factor on the dependent numerical target factor. This research aims to establish a benchmark approach for numerical attribute partitioning. We conduct an extensive analysis of human perceptions of partitioning a numerical attribute and compare these perceptions with the results obtained from our two proposed measures. We also examine the perceptions of experts in data science, statistics, and engineering by employing numerical data visualization techniques. The analysis of collected responses reveals that $68.7\%$ of human responses approximately closely align with the values generated by our proposed measures. Based on these findings, our proposed measures may be used as one of the methods for discretizing the numerical attributes.


著者 Minakshi Kaushik,Rahul Sharma,Dirk Draheim
発行日 2023-11-06 17:20:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク