要約
このペーパーでは、WebとDarkNetから収集されたデータセット、およびWebページの合成データを使用したWebページCaptchas検出のYolov5、Yolov8、およびYolov10モデルの分析と比較を提供します。
この研究では、ヨロアーキテクチャのナノ(n)、小(s)、および中程度(m)バリアントを調べ、精度、リコール、F1スコア、マップ@50、推論速度などのメトリックを使用して実生活の有用性を決定します。
さらに、実生活のアプリケーションの重要な部分であるため、訓練されたモデルを効率的に検出するために訓練されたモデルを調整する可能性が調べられました。
画像スライス法は、ウェブページ分析の一般的なシナリオとなる可能性のある特大の入力画像の検出メトリックを改善する方法として提案されました。
バージョンNANOのモデルは、速度の点で最高の結果を達成しましたが、より複雑なアーキテクチャは他のメトリックの点でより良く獲得しました。
要約(オリジナル)
This paper provides an analysis and comparison of the YOLOv5, YOLOv8 and YOLOv10 models for webpage CAPTCHAs detection using the datasets collected from the web and darknet as well as synthetized data of webpages. The study examines the nano (n), small (s), and medium (m) variants of YOLO architectures and use metrics such as Precision, Recall, F1 score, mAP@50 and inference speed to determine the real-life utility. Additionally, the possibility of tuning the trained model to detect new CAPTCHA patterns efficiently was examined as it is a crucial part of real-life applications. The image slicing method was proposed as a way to improve the metrics of detection on oversized input images which can be a common scenario in webpages analysis. Models in version nano achieved the best results in terms of speed, while more complexed architectures scored better in terms of other metrics.
arxiv情報
著者 | Mikołaj Wysocki,Henryk Gierszal,Piotr Tyczka,Sophia Karagiorgou,George Pantelis |
発行日 | 2025-02-19 14:05:50+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google