要約
順序分類(OC)は、ラベルが自然な順序を示す分類タスクに対処する機械学習フィールドです。
すべてのクラスを等しく異なるものとして扱う名目分類とは異なり、OCは順序関係を考慮に入れ、より正確で関連性のある結果を生み出します。
これは、分類エラーの大きさが影響を与えるアプリケーションで特に重要です。
それにもかかわらず、OCの問題は多くの場合、公称方法を使用して取り組まれ、最適ではないソリューションにつながります。
意思決定ツリーは最も人気のある分類アプローチの1つですが、他の分類器と比較して、順序ツリーベースのアプローチはあまり注目されていません。
この作業は、順序関係をキャプチャするために特別に設計された樹木ベースの方法論の実験的研究を実施します。
順序分割基準の包括的な調査が提供され、明確にするために文献で使用される表記法を標準化します。
3つの順序分割基準、順序ジニ(ogini)、加重情報ゲイン(WIG)、およびランキング不純物(RI)は、決定ツリー分類器に組み込むことにより、最初の2つの名目対応(GINIおよび情報ゲイン)と比較されます。
。
よく知られているOC評価メトリックを使用した順序と公称分割基準の最初の実験的比較をサポートする、45の公開されているOCデータセットを考慮した広範なリポジトリが提示されています。
結果の統計分析は、Oginiがこれまでで最も効果的な順序分割基準として強調しています。
ソースコード、データセット、および結果は、研究コミュニティが利用できるようになります。
要約(オリジナル)
Ordinal Classification (OC) is a machine learning field that addresses classification tasks where the labels exhibit a natural order. Unlike nominal classification, which treats all classes as equally distinct, OC takes the ordinal relationship into account, producing more accurate and relevant results. This is particularly critical in applications where the magnitude of classification errors has implications. Despite this, OC problems are often tackled using nominal methods, leading to suboptimal solutions. Although decision trees are one of the most popular classification approaches, ordinal tree-based approaches have received less attention when compared to other classifiers. This work conducts an experimental study of tree-based methodologies specifically designed to capture ordinal relationships. A comprehensive survey of ordinal splitting criteria is provided, standardising the notations used in the literature for clarity. Three ordinal splitting criteria, Ordinal Gini (OGini), Weighted Information Gain (WIG), and Ranking Impurity (RI), are compared to the nominal counterparts of the first two (Gini and information gain), by incorporating them into a decision tree classifier. An extensive repository considering 45 publicly available OC datasets is presented, supporting the first experimental comparison of ordinal and nominal splitting criteria using well-known OC evaluation metrics. Statistical analysis of the results highlights OGini as the most effective ordinal splitting criterion to date. Source code, datasets, and results are made available to the research community.
arxiv情報
著者 | Rafael Ayllón-Gavilán,Francisco José Martínez-Estudillo,David Guijo-Rubio,César Hervás-Martínez,Pedro Antonio Gutiérrez |
発行日 | 2025-02-17 18:53:15+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google