Flattening the Parent Bias: Hierarchical Semantic Segmentation in the Poincaré Ball

要約

階層は、画像セグメンテーションで日常的に使用されるものを含む、意味分類の自然な表現です。
実際、セマンティック セグメンテーションに関する最近の研究では、階層ラベル構造を活用した教師ありトレーニングの精度が向上しました。
これらの結果に励まされて、私たちはその研究の背後にある基本的な前提を再検討します。
私たちは、観察されたセグメンテーション精度の向上の理由は、セマンティック階層の使用とはまったく無関係である可能性があることを仮定し、経験的に検証します。
これを実証するために、代表的な階層アプローチを使用したさまざまなクロスドメイン実験を設計します。
新しいテスト ドメインでは、親が子から推測されるフラット (非階層) セグメンテーション ネットワークが、全体的に階層的アプローチよりも優れたセグメンテーション精度を備えていることがわかりました。
これらの発見を補完し、双曲空間の固有の特性に触発されて、私たちはポアンカレ ボール モデルを使用した階層セグメンテーションへのより原理的なアプローチを研究します。
双曲線表現は、以前の (ユークリッド) 階層アプローチよりも大幅に優れており、セグメンテーション精度の点でフラット ユークリッド ベースラインと同等です。
ただし、特により困難なドメインでは、セマンティック階層内の親ノードの驚くほど強力なキャリブレーション品質も示します。
私たちの組み合わせた分析は、階層的セグメンテーションの確立された実践がドメイン内設定に限定されている可能性があるのに対し、フラット分類器は、特に双曲空間でモデル化されている場合に、実質的により良く一般化できることを示唆しています。

要約(オリジナル)

Hierarchy is a natural representation of semantic taxonomies, including the ones routinely used in image segmentation. Indeed, recent work on semantic segmentation reports improved accuracy from supervised training leveraging hierarchical label structures. Encouraged by these results, we revisit the fundamental assumptions behind that work. We postulate and then empirically verify that the reasons for the observed improvement in segmentation accuracy may be entirely unrelated to the use of the semantic hierarchy. To demonstrate this, we design a range of cross-domain experiments with a representative hierarchical approach. We find that on the new testing domains, a flat (non-hierarchical) segmentation network, in which the parents are inferred from the children, has superior segmentation accuracy to the hierarchical approach across the board. Complementing these findings and inspired by the intrinsic properties of hyperbolic spaces, we study a more principled approach to hierarchical segmentation using the Poincar\’e ball model. The hyperbolic representation largely outperforms the previous (Euclidean) hierarchical approach as well and is on par with our flat Euclidean baseline in terms of segmentation accuracy. However, it additionally exhibits surprisingly strong calibration quality of the parent nodes in the semantic hierarchy, especially on the more challenging domains. Our combined analysis suggests that the established practice of hierarchical segmentation may be limited to in-domain settings, whereas flat classifiers generalize substantially better, especially if they are modeled in the hyperbolic space.

arxiv情報

著者 Simon Weber,Barış Zöngür,Nikita Araslanov,Daniel Cremers
発行日 2024-04-15 09:55:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク