Understanding Hyperbolic Metric Learning through Hard Negative Sampling

要約

近年、双曲幾何学手法をコンピュータ ビジョンに組み込む傾向が高まっています。
これらの手法は、双曲線距離測定を使用したさまざまな計量学習タスクで最先端のパフォーマンスを達成しましたが、この優れたパフォーマンスを裏付ける基礎となる理論分析は依然として十分に活用されていません。
この研究では、特に対比損失を伴うトレーニング時に双曲空間を計量学習に統合した場合の効果を調査します。
既存の文献の中で、コントラスト損失における温度効果に関して、ユークリッド空間と双曲空間の間の包括的な比較の必要性を確認しました。
このギャップに対処するために、ユークリッド空間と双曲空間からの損失を組み合わせたハイブリッド目的関数を使用して、ビジョン トランスフォーマー (ViT) の結果をベンチマークする広範な調査を実施します。
さらに、観察されたパフォーマンス向上の理論的分析も提供します。
また、双曲線計量学習がハード ネガティブ サンプリングと密接に関連していることも明らかにし、今後の研究への洞察を提供します。
この研究は、双曲線画像埋め込みを理解する上で貴重なデータ ポイントと経験を提供します。
問題解決にさらに光を当て、私たちのアプローチのさらなる調査を促すために、私たちのコードはオンラインで入手できます (https://github.com/YunYunY/HypMix)。

要約(オリジナル)

In recent years, there has been a growing trend of incorporating hyperbolic geometry methods into computer vision. While these methods have achieved state-of-the-art performance on various metric learning tasks using hyperbolic distance measurements, the underlying theoretical analysis supporting this superior performance remains under-exploited. In this study, we investigate the effects of integrating hyperbolic space into metric learning, particularly when training with contrastive loss. We identify a need for a comprehensive comparison between Euclidean and hyperbolic spaces regarding the temperature effect in the contrastive loss within the existing literature. To address this gap, we conduct an extensive investigation to benchmark the results of Vision Transformers (ViTs) using a hybrid objective function that combines loss from Euclidean and hyperbolic spaces. Additionally, we provide a theoretical analysis of the observed performance improvement. We also reveal that hyperbolic metric learning is highly related to hard negative sampling, providing insights for future work. This work will provide valuable data points and experience in understanding hyperbolic image embeddings. To shed more light on problem-solving and encourage further investigation into our approach, our code is available online (https://github.com/YunYunY/HypMix).

arxiv情報

著者 Yun Yue,Fangzhou Lin,Guanyi Mou,Ziming Zhang
発行日 2024-04-23 21:11:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク