要約
距離ベースの教師あり手法である最小学習機械は、入力距離行列と出力距離行列の間のマッピングを学習することにより、データから予測モデルを構築します。
この論文では、新しい方法を提案し、そのコアコンポーネントである距離マッピングがマルチラベル学習にどのように適応できるかを評価します。
提案されたアプローチは、距離マッピングと逆距離重み付けの組み合わせに基づいています。
この提案は、マルチラベル学習文献の中で最も単純な方法の 1 つですが、小規模から中規模のマルチラベル学習問題に対して最先端のパフォーマンスを実現します。
その単純さに加えて、提案された方法は完全に決定論的です。そのハイパーパラメータは、閉じた形式を持つ損失ベースの統計のランク付けによって選択できるため、従来の相互検証ベースのハイパーパラメータ調整が回避されます。
さらに、単純な線形距離マッピングに基づく構築により、提案された方法がマルチラベル分類の予測の不確実性を評価できることを実証します。これは、データ中心の機械学習パイプラインにとって貴重な機能です。
要約(オリジナル)
Distance-based supervised method, the minimal learning machine, constructs a predictive model from data by learning a mapping between input and output distance matrices. In this paper, we propose new methods and evaluate how their core component, the distance mapping, can be adapted to multi-label learning. The proposed approach is based on combining the distance mapping with an inverse distance weighting. Although the proposal is one of the simplest methods in the multi-label learning literature, it achieves state-of-the-art performance for small to moderate-sized multi-label learning problems. In addition to its simplicity, the proposed method is fully deterministic: Its hyper-parameter can be selected via ranking loss-based statistic which has a closed form, thus avoiding conventional cross-validation-based hyper-parameter tuning. In addition, due to its simple linear distance mapping-based construction, we demonstrate that the proposed method can assess the uncertainty of the predictions for multi-label classification, which is a valuable capability for data-centric machine learning pipelines.
arxiv情報
著者 | Joonas Hämäläinen,Antoine Hubermont,Amauri Souza,César L. C. Mattos,João P. P. Gomes,Tommi Kärkkäinen |
発行日 | 2024-12-04 15:32:32+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google