Few-shot $\mathbf{1/a}$ Anomalies Feedback : Damage Vision Mining Opportunity and Embedding Feature Imbalance

要約

過去 10 年間にわたり、以前のバランスのとれたデータセットは、産業アプリケーション向けの深層学習アルゴリズムを進歩させるために使用されてきました。
都市インフラや生活環境では、まれに目に見えないイベントや改善された運用の高品質な状態により、損傷データマイニングではデータの不均衡の問題を避けることができません。
目視検査では、コンクリートと鋼製コンポーネントの表面から取得される劣化クラスが不均衡である場合があります。
多数の関連調査から、不均衡なデータの問題は 4 つのタイプに分類できると結論付けています: 1) ターゲットとラベルの貴重な範囲の欠落、2) 多数派と少数派のクラスの不均衡、3) 空間的不均衡の前景背景、4) ロングテール
ピクセル単位の不均衡のクラス。
2015 年以来、回帰、画像分類、物体検出、セマンティック セグメンテーションなどの深層学習アプローチを使用して、多くの不均衡な研究が実施されてきました。
ただし、不均衡なデータの異常検出はあまり知られていません。
この研究では、異常クラスかどうかに関係なく、1 クラスの異常検出アプリケーションに焦点を当て、医学的疾患、危険な行為、材料の劣化、植物の病気、川のヘドロ、災害による被害など、不均衡な視覚データセットの明確な例を示します。
私たちは、ダメージビジョンマイニングの利点に関する重要な結果を提供し、正の比率の範囲がより効果的であればあるほど、異常フィードバックの精度が向上するという仮説を立てています。
私たちの不均衡な研究では、$1/1$ の正の比率を持つ均衡のとれたケースと比較して、精度が一貫して高い正の比率 $1/a$ が存在することがわかりました。
ただし、非常にアンバランスな範囲は 1 ショットから $1/2a$ であり、その精度は該当する比率よりも劣ります。
対照的に、プラスの比率が $2/a$ を超える範囲では、精度が効果的に向上することなく、オーバーマイニング段階に移行します。

要約(オリジナル)

Over the past decade, previous balanced datasets have been used to advance deep learning algorithms for industrial applications. In urban infrastructures and living environments, damage data mining cannot avoid imbalanced data issues because of rare unseen events and the high-quality status of improved operations. For visual inspection, the deteriorated class acquired from the surface of concrete and steel components are occasionally imbalanced. From numerous related surveys, we conclude that imbalanced data problems can be categorised into four types: 1) missing range of target and label valuables, 2) majority-minority class imbalance, 3) foreground background of spatial imbalance, and 4) long-tailed class of pixel-wise imbalance. Since 2015, many imbalanced studies have been conducted using deep-learning approaches, including regression, image classification, object detection, and semantic segmentation. However, anomaly detection for imbalanced data is not well known. In this study, we highlight a one-class anomaly detection application, whether anomalous class or not, and demonstrate clear examples of imbalanced vision datasets: medical disease, hazardous behaviour, material deterioration, plant disease, river sludge, and disaster damage. We provide key results on the advantage of damage-vision mining, hypothesising that the more effective the range of the positive ratio, the higher the accuracy gain of the anomalies feedback. In our imbalanced studies, compared with the balanced case with a positive ratio of $1/1$, we find that there is an applicable positive ratio $1/a$ where the accuracy is consistently high. However, the extremely imbalanced range is from one shot to $1/2a$, the accuracy of which is inferior to that of the applicable ratio. In contrast, with a positive ratio ranging over $2/a$, it shifts in the over-mining phase without an effective gain in accuracy.

arxiv情報

著者 Takato Yasuno
発行日 2023-08-29 14:48:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, I.2.10 パーマリンク