要約
ほとんどのコンピューター ビジョン アプリケーションは、シーン内のピクセルを識別し、それらをさまざまな目的に使用することを目的としています。
興味深いアプリケーションの 1 つは、保険会社向けの車両損傷検出です。この用途では、走行前と走行後の画像を比較することによってすべての車両損傷を検出する傾向があり、次の 2 つのコンポーネントが必要になります。(i) 車の損傷検出。
(ii) 画像の位置合わせ。
まず、カスタム画像上の車両の損傷を検出するためにマスク R-CNN モデルを実装しました。
一方、画像位置合わせセクションでは、従来のコンピュータ ビジョン手法を除いて、カスタムのレンタカー前/後のカスタム画像間の透視変換を見つけるための、新しい自己監視型のパッチ間 SimCLR にヒントを得た位置合わせアプローチを特に提案します。
要約(オリジナル)
Most computer vision applications aim to identify pixels in a scene and use them for diverse purposes. One intriguing application is car damage detection for insurance carriers which tends to detect all car damages by comparing both pre-trip and post-trip images, even requiring two components: (i) car damage detection; (ii) image alignment. Firstly, we implemented a Mask R-CNN model to detect car damages on custom images. Whereas for the image alignment section, we especially propose a novel self-supervised Patch-to-Patch SimCLR inspired alignment approach to find perspective transformations between custom pre/post car rental images except for traditional computer vision methods.
arxiv情報
著者 | Hanxiao Chen |
発行日 | 2024-03-11 12:46:53+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google