要約
我々は、ひび割れやポットホールなどの特定のものだけに限定されない様々な舗装障害を自動的に検出するための、反復最適化パッチラベル推論ネットワーク(IOPLIN)と名付けられた新しい深層学習フレームワークを提示する。IOPLINは、EMIPLD(Expectation-Maximization Inspired Patch Label Distillation)戦略により、画像ラベルのみを用いて繰り返し学習することができ、舗装画像からパッチのラベルを推測することでこのタスクをうまく達成することができる。IOPLINは、GoogLeNetやEfficientNetといった最先端の単一枝CNNモデルに対して、多くの望ましい特性を享受しています。IOPLINは、画像全体ではなく、修正されていない画像パッチから視覚的特徴を抽出するため、異なる解像度の画像を扱うことができ、特に高解像度の画像情報を十分に活用することができる。また、IOPLINは、学習段階において、事前の局所化情報を用いることなく、舗装の凹凸を大まかに特定することができます。本手法の有効性を評価するために、60,059枚の高解像度舗装画像からなる大規模な瀝青舗装障害検出データセットCQU-BPDDを構築した(異なる時間、異なる地域から取得した画像)。このデータセットに対する広範な結果は、舗装の自動欠陥検出において、IOPLINが最新の画像分類アプローチよりも優れていることを実証しています。なお、IOPLINのソースコードについては、「FUJIFILM CQU-BPDD」にて公開しています。また、CQU-BPDDのデータセットについては、「FUJIFILM CQU-BPDD」にて公開しています。
要約(オリジナル)
We present a novel deep learning framework named the Iteratively Optimized Patch Label Inference Network (IOPLIN) for automatically detecting various pavement distresses that are not solely limited to specific ones, such as cracks and potholes. IOPLIN can be iteratively trained with only the image label via the Expectation-Maximization Inspired Patch Label Distillation (EMIPLD) strategy, and accomplish this task well by inferring the labels of patches from the pavement images. IOPLIN enjoys many desirable properties over the state-of-the-art single branch CNN models such as GoogLeNet and EfficientNet. It is able to handle images in different resolutions, and sufficiently utilize image information particularly for the high-resolution ones, since IOPLIN extracts the visual features from unrevised image patches instead of the resized entire image. Moreover, it can roughly localize the pavement distress without using any prior localization information in the training phase. In order to better evaluate the effectiveness of our method in practice, we construct a large-scale Bituminous Pavement Disease Detection dataset named CQU-BPDD consisting of 60,059 high-resolution pavement images, which are acquired from different areas at different times. Extensive results on this dataset demonstrate the superiority of IOPLIN over the state-of-the-art image classification approaches in automatic pavement distress detection. The source codes of IOPLIN are released on \url{https://github.com/DearCaat/ioplin}, and the CQU-BPDD dataset is able to be accessed on \url{https://dearcaat.github.io/CQU-BPDD/}.
arxiv情報
| 著者 | Wenhao Tang,Sheng Huang,Qiming Zhao,Ren Li,Luwen Huangfu |
| 発行日 | 2022-09-08 07:09:12+00:00 |
| arxivサイト | arxiv_id(pdf) |