Outlier detection using flexible categorisation and interrogative agendas

要約

分類は、機械学習とデータ分析の基本的なタスクの 1 つです。
形式的概念分析 (FCA) に基づいて構築された現在の研究の出発点は、特定のオブジェクトのセットを分類するさまざまな方法が存在し、それらの分類に使用される特徴のセットの選択と、そのような特徴のセットの違いに依存するということです。
目前のタスクに比べて、より良い分類が得られる場合もあれば、より悪い分類が得られる場合もあります。
今度は、特定の特徴セットを別の特徴セットよりも(アプリオリに)選択することは主観的であり、エージェントまたはエージェントのグループの特定の認識論的立場(たとえば、興味、関連性、好み)、つまり彼らの疑問的な議題を表現する可能性があります。
この論文では、疑問的な議題を一連の特徴として表し、オブジェクトを分類するためのさまざまな方法を調査および比較します。
さまざまな機能セット (アジェンダ)。
まず、さまざまなアジェンダから生じる分類を使用する、外れ値検出のための単純な教師なし FCA ベースのアルゴリズムを開発します。
次に、分類に適した (ファジーな) アジェンダを、異なる重みまたは質量を持つ特徴のセットとして学習するための教師ありメタ学習アルゴリズムを提示します。
このメタ学習アルゴリズムを教師なし外れ値検出アルゴリズムと組み合わせて、教師あり外れ値検出アルゴリズムを取得します。
これらのアルゴリズムが、外れ値検出で一般的に使用されるデータセットでの外れ値検出に一般的に使用されるアルゴリズムと同等に機能することを示します。
これらのアルゴリズムは、結果のローカルおよびグローバルの両方の説明を提供します。

要約(オリジナル)

Categorization is one of the basic tasks in machine learning and data analysis. Building on formal concept analysis (FCA), the starting point of the present work is that different ways to categorize a given set of objects exist, which depend on the choice of the sets of features used to classify them, and different such sets of features may yield better or worse categorizations, relative to the task at hand. In their turn, the (a priori) choice of a particular set of features over another might be subjective and express a certain epistemic stance (e.g. interests, relevance, preferences) of an agent or a group of agents, namely, their interrogative agenda. In the present paper, we represent interrogative agendas as sets of features, and explore and compare different ways to categorize objects w.r.t. different sets of features (agendas). We first develop a simple unsupervised FCA-based algorithm for outlier detection which uses categorizations arising from different agendas. We then present a supervised meta-learning algorithm to learn suitable (fuzzy) agendas for categorization as sets of features with different weights or masses. We combine this meta-learning algorithm with the unsupervised outlier detection algorithm to obtain a supervised outlier detection algorithm. We show that these algorithms perform at par with commonly used algorithms for outlier detection on commonly used datasets in outlier detection. These algorithms provide both local and global explanations of their results.

arxiv情報

著者 Marcel Boersma,Krishna Manoorkar,Alessandra Palmigiano,Mattia Panettiere,Apostolos Tzimoulis,Nachoem Wijnberg
発行日 2023-12-20 10:51:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク