An Interactive Interface for Novel Class Discovery in Tabular Data

要約

Novel Class Discovery (NCD) は、異なるが関連するクラスのラベル付きセットが与えられた場合に、ラベルなしのセット内で新しいクラスを検出しようとする問題です。
表形式データは実際のアプリケーションで最も広く使用されているタイプのデータの 1 つであるにもかかわらず、これまでに提案されている NCD 手法の大部分は画像データのみを扱います。
クラスタリングまたは NCD アルゴリズムの結果を解釈するには、データ サイエンティストは表形式データのドメイン固有およびアプリケーション固有の属性を理解する必要があります。
このタスクは難しく、多くの場合、ドメインの専門家のみが実行できます。
したがって、このインターフェイスを使用すると、ドメインの専門家は、表形式のデータで NCD の最先端のアルゴリズムを簡単に実行できます。
データ サイエンスに関する最小限の知識があれば、解釈可能な結果を​​生成できます。

要約(オリジナル)

Novel Class Discovery (NCD) is the problem of trying to discover novel classes in an unlabeled set, given a labeled set of different but related classes. The majority of NCD methods proposed so far only deal with image data, despite tabular data being among the most widely used type of data in practical applications. To interpret the results of clustering or NCD algorithms, data scientists need to understand the domain- and application-specific attributes of tabular data. This task is difficult and can often only be performed by a domain expert. Therefore, this interface allows a domain expert to easily run state-of-the-art algorithms for NCD in tabular data. With minimal knowledge in data science, interpretable results can be generated.

arxiv情報

著者 Colin Troisemaine,Joachim Flocon-Cholet,Stéphane Gosselin,Alexandre Reiffers-Masson,Sandrine Vaton,Vincent Lemaire
発行日 2023-06-22 14:32:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.HC, cs.LG パーマリンク