要約
相関クラスタリングは、正と負のペアごとの類似性を扱うよく知られた教師なし学習設定です。
この論文では、ペアごとの類似性が事前に与えられておらず、コスト効率の高い方法でクエリする必要がある場合について研究します。
これにより、ユーザー/アノテーターが提供できるフィードバックの種類の柔軟性、あらゆる相関クラスタリング アルゴリズムとクエリ戦略への適応、ノイズに対する堅牢性など、いくつかの利点から恩恵を受ける、このタスク用の汎用アクティブ ラーニング フレームワークを開発します。
さらに、この設定に適した多数の新しいクエリ戦略を提案および分析します。
いくつかの実験研究を通じて、フレームワークと提案されたクエリ戦略の有効性を実証します。
要約(オリジナル)
Correlation clustering is a well-known unsupervised learning setting that deals with positive and negative pairwise similarities. In this paper, we study the case where the pairwise similarities are not given in advance and must be queried in a cost-efficient way. Thereby, we develop a generic active learning framework for this task that benefits from several advantages, e.g., flexibility in the type of feedback that a user/annotator can provide, adaptation to any correlation clustering algorithm and query strategy, and robustness to noise. In addition, we propose and analyze a number of novel query strategies suited to this setting. We demonstrate the effectiveness of our framework and the proposed query strategies via several experimental studies.
arxiv情報
著者 | Linus Aronsson,Morteza Haghir Chehreghani |
発行日 | 2024-01-25 17:51:12+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google