要約
タイトル: コンピュータビジョンにおける双曲幾何学:調査
要約:
– 双曲幾何学は,一定の断面負曲率を有するリーマン多様体であり,階層構造を持つデータをエンコードするという興味深い特性から,自然言語処理,グラフ学習などの学習シナリオで代替埋め込み空間として考慮されている。
– 最近の研究では,視覚データセットにもこのようなデータ階層が存在することが証明されており,コンピュータビジョン(CV)領域での双曲幾何学の成功した実践が調査されています。その範囲は,古典的な画像分類から高度なモデル適応学習まで広がっている。
– 本論文では,CVアプリケーションのための双曲空間の最初で最新の文献レビューを提供する。そのために,最初に双曲幾何学の背景を紹介し,双曲空間の幾何的な事前知識を持つアルゴリズムについて包括的に調査します。また、本稿を締めくくり、可能な将来の方向性を特定します。
要約(オリジナル)
Hyperbolic geometry, a Riemannian manifold endowed with constant sectional negative curvature, has been considered an alternative embedding space in many learning scenarios, \eg, natural language processing, graph learning, \etc, as a result of its intriguing property of encoding the data’s hierarchical structure (like irregular graph or tree-likeness data). Recent studies prove that such data hierarchy also exists in the visual dataset, and investigate the successful practice of hyperbolic geometry in the computer vision (CV) regime, ranging from the classical image classification to advanced model adaptation learning. This paper presents the first and most up-to-date literature review of hyperbolic spaces for CV applications. To this end, we first introduce the background of hyperbolic geometry, followed by a comprehensive investigation of algorithms, with geometric prior of hyperbolic space, in the context of visual applications. We also conclude this manuscript and identify possible future directions.
arxiv情報
著者 | Pengfei Fang,Mehrtash Harandi,Trung Le,Dinh Phung |
発行日 | 2023-04-21 06:22:16+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI