要約
高次元の測定値を正確にクラスタリングすることは、科学データを適切に分析するために不可欠です。
深層学習機械は、意味のある表現を抽出する能力により、近年クラスタリング機能を著しく改善しました。
この作業では、複数のソース ドメインからラベルのないサンプルが与えられ、サンプルをさまざまなクラスターに割り当てる共有分類器を学習することを目指しています。
評価は、分類器を使用して、これまでに見られなかったドメインでクラスターの割り当てを予測することによって行われます。
この設定は、教師なしドメイン一般化の問題を、教師あり学習サンプルが与えられていない (完全に教師なし) 場合に一般化します。
この目標に向けて、エンドツーエンドのモデルを提示し、いくつかのマルチドメイン画像データセットでその機能を評価します。
具体的には、対象ドメインからのサンプルを使用した微調整や、ある程度の監視を必要とするスキームよりも、モデルがより正確であることを示しています。
要約(オリジナル)
Accurately clustering high-dimensional measurements is vital for adequately analyzing scientific data. Deep learning machinery has remarkably improved clustering capabilities in recent years due to its ability to extract meaningful representations. In this work, we are given unlabeled samples from multiple source domains, and we aim to learn a shared classifier that assigns the examples to various clusters. Evaluation is done by using the classifier for predicting cluster assignments in a previously unseen domain. This setting generalizes the problem of unsupervised domain generalization to the case in which no supervised learning samples are given (completely unsupervised). Towards this goal, we present an end-to-end model and evaluate its capabilities on several multi-domain image datasets. Specifically, we demonstrate that our model is more accurate than schemes that require fine-tuning using samples from the target domain or some level of supervision.
arxiv情報
著者 | Amit Rozner,Barak Battash,Lior Wolf,Ofir Lindenbaum |
発行日 | 2023-01-31 10:24:50+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google