Image2PCI — A Multitask Learning Framework for Estimating Pavement Condition Indices Directly from Images

要約

舗装状態指数 (PCI) は、舗装表面で検出された損傷の種類、程度、重大度に基づいて舗装の性能を評価するために広く使用されている指標です。
最近、PCI 推定プロセスを自動化するためのディープラーニング アプローチの利用において大きな進歩が見られました。
しかし、現在のアプローチは、PCI 値を推定するために少なくとも 2 つの別個のモデルに依存しています。1 つはタイプと範囲の決定専用のモデルで、もう 1 つはその重大度の推定専用です。
このアプローチには、複雑さ、高い計算リソース要求、メンテナンスの負担など、慎重な検討と解決が必要ないくつかの課題があります。
これらの課題を克服するために、現在の研究では、トップダウンの舗装画像から直接 PCI を予測する統合マルチタスク モデルを開発しています。
提案されたアーキテクチャは、特徴抽出用の 1 つのエンコーダーと、特定のタスクを処理する 4 つのデコーダー (2 つの検出ヘッド、1 つのセグメンテーション ヘッド、および 1 つの PCI 推定ヘッド) で構成されるマルチタスク モデルです。
マルチタスクにより、検出およびセグメンテーション ヘッドから特徴を抽出し、画像から直接 PCI を自動的に推定することができます。
このモデルは、マルチタスク学習用に注釈が付けられたベンチマーク済みのオープン舗装遭難データセット (この種のものとしては初めて) で非常に優れたパフォーマンスを発揮します。
私たちの知る限り、これは、亀裂の検出とセグメンテーションに関連するすべてのタスクで優れた精度を維持しながら、リアルタイムの速度で画像から直接 PCI を推定できる最初の研究です。

要約(オリジナル)

The Pavement Condition Index (PCI) is a widely used metric for evaluating pavement performance based on the type, extent and severity of distresses detected on a pavement surface. In recent times, significant progress has been made in utilizing deep-learning approaches to automate PCI estimation process. However, the current approaches rely on at least two separate models to estimate PCI values — one model dedicated to determining the type and extent and another for estimating their severity. This approach presents several challenges, including complexities, high computational resource demands, and maintenance burdens that necessitate careful consideration and resolution. To overcome these challenges, the current study develops a unified multi-tasking model that predicts the PCI directly from a top-down pavement image. The proposed architecture is a multi-task model composed of one encoder for feature extraction and four decoders to handle specific tasks: two detection heads, one segmentation head and one PCI estimation head. By multitasking, we are able to extract features from the detection and segmentation heads for automatically estimating the PCI directly from the images. The model performs very well on our benchmarked and open pavement distress dataset that is annotated for multitask learning (the first of its kind). To our best knowledge, this is the first work that can estimate PCI directly from an image at real time speeds while maintaining excellent accuracy on all related tasks for crack detection and segmentation.

arxiv情報

著者 Neema Jakisa Owor,Hang Du,Abdulateef Daud,Armstrong Aboah,Yaw Adu-Gyamfi
発行日 2023-10-12 17:28:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク