要約
Web サイトを自動化されたボットから保護するセキュリティ メカニズムとしてテキストベースの CAPTCHA が普及したことにより、その失敗例を理解し、その後 CAPTCHA の安全性を高めることを目的とした CAPTCHA ソルバーの研究が促進されました。
最近提案されたソルバーは、深層学習の進歩に基づいて構築されており、非常に困難な CAPTCHA も高精度で解読できます。
ただし、これらのソルバーは、トレーニング セットとは異なる視覚的特徴を含む配布外のサンプルではパフォーマンスが低下することがよくあります。
さらに、そのようなサンプルを検出して回避する能力が欠けているため、一定回数失敗すると防御システムによってロックアウトされやすくなります。
この論文では、深いアンサンブルの不確実性を使用して配布範囲外の CAPTCHA を検出およびスキップし、検出を困難にする CAPTCHA ソルバー ファミリである EnSolver を提案します。
私たちはソルバーの有効性に関する新しい理論的限界を証明し、最先端の CAPTCHA ソルバーとの併用を実証します。
私たちの実験では、提案されたアプローチが、配布内サンプルと配布外サンプルの両方を含む CAPTCHA データセットを解読する際にうまく機能することがわかりました。
要約(オリジナル)
The popularity of text-based CAPTCHA as a security mechanism to protect websites from automated bots has prompted researches in CAPTCHA solvers, with the aim of understanding its failure cases and subsequently making CAPTCHAs more secure. Recently proposed solvers, built on advances in deep learning, are able to crack even the very challenging CAPTCHAs with high accuracy. However, these solvers often perform poorly on out-of-distribution samples that contain visual features different from those in the training set. Furthermore, they lack the ability to detect and avoid such samples, making them susceptible to being locked out by defense systems after a certain number of failed attempts. In this paper, we propose EnSolver, a family of CAPTCHA solvers that use deep ensemble uncertainty to detect and skip out-of-distribution CAPTCHAs, making it harder to be detected. We prove novel theoretical bounds on the effectiveness of our solvers and demonstrate their use with state-of-the-art CAPTCHA solvers. Our experiments show that the proposed approaches perform well when cracking CAPTCHA datasets that contain both in-distribution and out-of-distribution samples.
arxiv情報
著者 | Duc C. Hoang,Behzad Ousat,Amin Kharraz,Cuong V. Nguyen |
発行日 | 2024-06-28 16:40:39+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google