Contrastive Learning for Lane Detection via Cross-Similarity

要約

道路車線の検出は、悪条件に弱い複雑な標示のために困難である。車線標示は強力な形状事前分布を持つが、その視認性は容易に損なわれる。照明、天候、車両、歩行者、老朽化した色などの要因が検出を困難にする。視認性の低下による自然変動に耐える車線検出アプローチを訓練するには、大量のデータが必要である。これは、車線の形状や自然なバリエーションが数多く存在するためである。私たちのソリューションであるContrastive Learning for Lane Detection via cross-similarity (CLLD)は、車線検出モデルの耐性を向上させることで、この課題に取り組む自己教師付き学習手法である。CLLDは、新しいマルチタスク対比学習であり、局所特徴対比学習(CL)と我々が提案する新しい操作交差類似性を統合することで、視認性の低い状況でもレーンマークを検出できるようにレーン検出アプローチを訓練する。局所特徴対比学習(local feature contrastive learning, CL)は、車線区間を局所的に検出するために必要な小さな画像部分の特徴を抽出することに重点を置く。我々は、入力画像の一部をランダムにマスクすることにより、交差類似度を増強する。ベンチマークデータセットで評価した結果、CLLDは、特に影のような視認性が損なわれる条件下において、最新のコントラスト学習を凌駕した。教師あり学習と比較して、CLLDは影や混雑したシーンなどのシナリオにおいて優れている。

要約(オリジナル)

Detecting road lanes is challenging due to intricate markings vulnerable to unfavorable conditions. Lane markings have strong shape priors, but their visibility is easily compromised. Factors like lighting, weather, vehicles, pedestrians, and aging colors challenge the detection. A large amount of data is required to train a lane detection approach that can withstand natural variations caused by low visibility. This is because there are numerous lane shapes and natural variations that exist. Our solution, Contrastive Learning for Lane Detection via cross-similarity (CLLD), is a self-supervised learning method that tackles this challenge by enhancing lane detection models resilience to real-world conditions that cause lane low visibility. CLLD is a novel multitask contrastive learning that trains lane detection approaches to detect lane markings even in low visible situations by integrating local feature contrastive learning (CL) with our new proposed operation cross-similarity. Local feature CL focuses on extracting features for small image parts, which is necessary to localize lane segments, while cross-similarity captures global features to detect obscured lane segments using their surrounding. We enhance cross-similarity by randomly masking parts of input images for augmentation. Evaluated on benchmark datasets, CLLD outperforms state-of-the-art contrastive learning, especially in visibility-impairing conditions like shadows. Compared to supervised learning, CLLD excels in scenarios like shadows and crowded scenes.

arxiv情報

著者 Ali Zoljodi,Sadegh Abadijou,Mina Alibeigi,Masoud Daneshtalab
発行日 2023-09-01 08:12:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク