要約
特徴量正規化の主題は、データ表現、特徴付け、視覚化、分析、比較、分類、およびモデリングにおいて重要な中心的な役割を果たします。これは、これらすべてのアクティビティとそれぞれの側面に実質的に影響を与えたり、影響を受ける可能性があるためです。
適切な正規化方法を選択するには、関連する特徴のタイプと特性、先ほど述べたデータ処理に後で使用される方法、および考慮されている特定の質問を考慮する必要があります。
通常、データ分析とモデリングに関係する多くの相互に関連する部分の 1 つとして正規化がどのように構成されているかを簡単に検討した後、本研究では、均一で比例した (右に歪んだ) 特徴と比較演算の観点から特徴正規化の重要な問題に取り組みました。
より一般的な右に歪んだ特徴も近似的に考慮されます。
一様特徴空間と比例特徴空間とそれぞれの比較の間の双対関係の説明を含め、いくつかの概念、特性、および結果が説明され、議論され、2 つの領域のそれぞれにおける比較間の一貫性の条件が指定されます。
特徴の非集中分散に基づく 2 つの正規化の可能性も示し、本質的に正規化を組み込んだ Jaccard 類似性インデックスの修正バージョンについても説明します。
開発された概念と方法を説明するために、予備実験が示されています。
要約(オリジナル)
The subject of features normalization plays an important central role in data representation, characterization, visualization, analysis, comparison, classification, and modeling, as it can substantially influence and be influenced by all of these activities and respective aspects. The selection of an appropriate normalization method needs to take into account the type and characteristics of the involved features, the methods to be used subsequently for the just mentioned data processing, as well as the specific questions being considered. After briefly considering how normalization constitutes one of the many interrelated parts typically involved in data analysis and modeling, the present work addressed the important issue of feature normalization from the perspective of uniform and proportional (right skewed) features and comparison operations. More general right skewed features are also considered in an approximated manner. Several concepts, properties, and results are described and discussed, including the description of a duality relationship between uniform and proportional feature spaces and respective comparisons, specifying conditions for consistency between comparisons in each of the two domains. Two normalization possibilities based on non-centralized dispersion of features are also presented, and also described is a modified version of the Jaccard similarity index which incorporates intrinsically normalization. Preliminary experiments are presented in order to illustrate the developed concepts and methods.
arxiv情報
著者 | Alexandre Benatti,Luciano da F. Costa |
発行日 | 2024-09-17 17:46:27+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google