要約
マルチラベル分類は、インスタンスに複数のラベルを同時に割り当てることができる教師あり機械学習の一種です。
このタスクを解決するために、元の問題をいくつかのサブ問題に分割する方法 (ローカル アプローチ)、すべてのラベルを一度に学習する方法 (グローバル アプローチ)、および複数の分類子を組み合わせる方法 (アンサンブル アプローチ) があります。
使用するアプローチに関係なく、分類器の予測を改善するには、ラベルの相関関係を探索して学習することが重要です。
アンサンブル オブ クラシファイア チェーン (ECC) は、ラベル相関を考慮するよく知られたマルチラベル手法であり、複数のマルチラベル データセットと評価尺度で優れた全体的なパフォーマンスを達成できます。
ただし、ECC を使用する場合の課題の 1 つは、ラベル空間の高次元性です。特徴空間の拡張に関して複雑さが増すと、完全にカスケードされたチェーンに制限が課される可能性があります。
分類子連鎖を改善するために、ラベル空間で分割法を適用することによって得られた互いに素な相関ラベルクラスターを連鎖する方法を提案します。
トレーニング フェーズでは、各クラスターのグラウンド トゥルース ラベルが、後続のすべてのクラスターの新しい特徴として使用されます。
テスト段階では、クラスターの予測されたラベルが、後続のすべてのクラスターの新しい特徴として使用されます。
マルチラベル分類のためのラベル クラスター チェーン (LCC-ML) と呼ばれる私たちの提案は、各クラスターの基本分類子としてマルチラベル ランダム フォレストを使用し、それらの予測を組み合わせて最終的なマルチラベル分類を取得します。
私たちの提案は、元の ECC と比較してより良い結果が得られました。
これは、互いに素な相関ラベル クラスターを学習および連鎖することで、ラベル相関をより適切に調査および学習できることを示しています。
要約(オリジナル)
Multi-label classification is a type of supervised machine learning that can simultaneously assign multiple labels to an instance. To solve this task, some methods divide the original problem into several sub-problems (local approach), others learn all labels at once (global approach), and others combine several classifiers (ensemble approach). Regardless of the approach used, exploring and learning label correlations is important to improve the classifier predictions. Ensemble of Classifier Chains (ECC) is a well-known multi-label method that considers label correlations and can achieve good overall performance on several multi-label datasets and evaluation measures. However, one of the challenges when working with ECC is the high dimensionality of the label space, which can impose limitations for fully-cascaded chains as the complexity increases regarding feature space expansion. To improve classifier chains, we propose a method to chain disjoint correlated label clusters obtained by applying a partition method in the label space. During the training phase, the ground truth labels of each cluster are used as new features for all of the following clusters. During the test phase, the predicted labels of clusters are used as new features for all the following clusters. Our proposal, called Label Cluster Chains for Multi-Label Classification (LCC-ML), uses multi-label Random Forests as base classifiers in each cluster, combining their predictions to obtain a final multi-label classification. Our proposal obtained better results compared to the original ECC. This shows that learning and chaining disjoint correlated label clusters can better explore and learn label correlations.
arxiv情報
著者 | Elaine Cecília Gatto,Felipe Nakano Kenji,Jesse Read,Mauri Ferrandin,Ricardo Cerri,Celine Vens |
発行日 | 2024-11-15 16:15:46+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google