要約
本稿では、セマンティックセグメンテーションのための新しいCNNベースの注意平滑化フレームワークであるGeloVecを紹介する。既存の注意に基づくセグメンテーション手法が、特徴マッピング中の境界の不安定性や文脈の不連続性に悩まされるのに対し、我々のフレームワークは、視覚的に首尾一貫した領域間のロバストな多様体関係を確立するために、高次元幾何学的平滑化手法を実装する。GeloVecは、修正されたチェビシェフ距離メトリクスと多空間変換を組み合わせ、安定化された特徴抽出によってセグメンテーション精度を向上させる。核となる技術革新は、n次元特徴空間における幾何学的距離を計算する適応的サンプリング重みシステムにあり、クラス内の均質性を維持しながら、優れたエッジ保存を達成する。多空間変換行列は、直交基底ベクトルによるテンソリアル投影を組み込み、計算効率を犠牲にすることなく、より識別性の高い特徴表現を作成する。複数のベンチマークデータセットにおける実験的検証により、セグメンテーション性能の大幅な向上が実証され、Caltech Birds-200、LSDSC、FSSDデータセットにおいて、それぞれ2.1%、2.7%、2.4%の平均Intersection over Union (mIoU)の向上が、最先端の手法と比較された。GeloVecのリーマン幾何学の数学的基礎は、セグメンテーションの安定性を理論的に保証する。重要な点として、我々のフレームワークは測地変換の並列実装により計算効率を維持し、変換中の情報損失がないため、分野横断的な強力な一般化能力を示す。
要約(オリジナル)
This paper introduces GeloVec, a new CNN-based attention smoothing framework for semantic segmentation that addresses critical limitations in conventional approaches. While existing attention-backed segmentation methods suffer from boundary instability and contextual discontinuities during feature mapping, our framework implements a higher-dimensional geometric smoothing method to establish a robust manifold relationships between visually coherent regions. GeloVec combines modified Chebyshev distance metrics with multispatial transformations to enhance segmentation accuracy through stabilized feature extraction. The core innovation lies in the adaptive sampling weights system that calculates geometric distances in n-dimensional feature space, achieving superior edge preservation while maintaining intra-class homogeneity. The multispatial transformation matrix incorporates tensorial projections with orthogonal basis vectors, creating more discriminative feature representations without sacrificing computational efficiency. Experimental validation across multiple benchmark datasets demonstrates significant improvements in segmentation performance, with mean Intersection over Union (mIoU) gains of 2.1%, 2.7%, and 2.4% on Caltech Birds-200, LSDSC, and FSSD datasets respectively compared to state-of-the-art methods. GeloVec’s mathematical foundation in Riemannian geometry provides theoretical guarantees on segmentation stability. Importantly, our framework maintains computational efficiency through parallelized implementation of geodesic transformations and exhibits strong generalization capabilities across disciplines due to the absence of information loss during transformations.
arxiv情報
著者 | Boris Kriuk,Matey Yordanov |
発行日 | 2025-05-02 07:07:00+00:00 |
arxivサイト | arxiv_id(pdf) |