Revisiting invariances and introducing priors in Gromov-Wasserstein distances

要約

グロモフ-ワッサーシュタイン距離は、計量空間全体で測定値を比較できる機能と等尺性変換に対する不変性により、機械学習で多くの用途が見出されています。
ただし、特定のアプリケーションでは、この不変特性が柔軟すぎるため、望ましくない場合があります。
さらに、グロモフ-ワッサーシュタイン距離では、生の特徴表現を無視して、入力データセット内のペアごとのサンプルの類似性のみが考慮されます。
私たちは、変換に対する剛性のレベルをある程度制御できる、Augmented Gromov-Wasserstein と呼ばれる新しい最適な輸送ベースの距離を提案します。
また、機能の調整も組み込まれているため、入力データに関する事前の知識をより適切に活用してパフォーマンスを向上させることができます。
提案された指標についての理論的な洞察を示します。
次に、単一細胞のマルチオミック アライメント タスクと機械学習における転移学習シナリオに対するその有用性を実証します。

要約(オリジナル)

Gromov-Wasserstein distance has found many applications in machine learning due to its ability to compare measures across metric spaces and its invariance to isometric transformations. However, in certain applications, this invariance property can be too flexible, thus undesirable. Moreover, the Gromov-Wasserstein distance solely considers pairwise sample similarities in input datasets, disregarding the raw feature representations. We propose a new optimal transport-based distance, called Augmented Gromov-Wasserstein, that allows for some control over the level of rigidity to transformations. It also incorporates feature alignments, enabling us to better leverage prior knowledge on the input data for improved performance. We present theoretical insights into the proposed metric. We then demonstrate its usefulness for single-cell multi-omic alignment tasks and a transfer learning scenario in machine learning.

arxiv情報

著者 Pinar Demetci,Quang Huy Tran,Ievgen Redko,Ritambhara Singh
発行日 2023-07-19 16:00:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-bio.GN, stat.ML パーマリンク