SINBAD: Saliency-informed detection of breakage caused by ad blocking

要約

フィルタリスト ルールに基づくプライバシー強化ブロック ツールは、正規の機能を破壊する傾向があります。
フィルタ リストの管理者は、問題のあるルールを数百万のユーザーに展開する前にプロアクティブに修正できる自動破損検出ツールの恩恵を受けることができます。
最新技術よりも精度が 20% 向上し、動的破損とスタイル指向のフィルター ルールによって引き起こされる破損を初めて検出する自動破損検出器である SINBAD を紹介します。
SINBAD の成功は、次の 3 つの革新に根ざしています。(1) フォーラムでユーザーが報告した破損の問題を使用することで、ユーザーが問題として認識している破損のみが含まれるトレーニング用の高品質なデータセットの作成が可能になります。
(2) 「Web 顕著性」を使用して、破損を引き起こすことを目的とした自動インタラクションを優先する Web サイトのユーザー関連領域を自動的に識別します。
(3) サブツリーを介した Web ページの分析により、問題のあるフィルター ルールをきめ細かく特定できます。

要約(オリジナル)

Privacy-enhancing blocking tools based on filter-list rules tend to break legitimate functionality. Filter-list maintainers could benefit from automated breakage detection tools that allow them to proactively fix problematic rules before deploying them to millions of users. We introduce SINBAD, an automated breakage detector that improves the accuracy over the state of the art by 20%, and is the first to detect dynamic breakage and breakage caused by style-oriented filter rules. The success of SINBAD is rooted in three innovations: (1) the use of user-reported breakage issues in forums that enable the creation of a high-quality dataset for training in which only breakage that users perceive as an issue is included; (2) the use of ‘web saliency’ to automatically identify user-relevant regions of a website on which to prioritize automated interactions aimed at triggering breakage; and (3) the analysis of webpages via subtrees which enables fine-grained identification of problematic filter rules.

arxiv情報

著者 Saiid El Hajj Chehade,Sandra Siby,Carmela Troncoso
発行日 2024-05-08 16:35:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CR, cs.LG パーマリンク