要約
最新の Web では、トラッカーや広告主が同意なしにユーザーの詳細な行動プロファイルを作成し、収益化することがよくあります。
Web 追跡メカニズムと広告についてはさまざまな研究が行われていますが、子供を対象とした Web サイトに焦点を当てた厳密な研究はありません。
このギャップに対処するために、子供向けの Web サイト上の追跡および (ターゲットを絞った) 広告の測定結果を示します。
子供向け (子供を対象とした) Web サイトの包括的なリストが不足していることを動機として、私たちはまず Web ページのタイトルと説明に基づいて多言語分類器を構築します。
この分類子を 200 万ページ以上に適用して、2,000 の子供向け Web サイトのリストを作成します。
5 つの有利な地点からこれらのサイトをクロールして、トラッカー、フィンガープリンティング スクリプト、および広告の蔓延を測定します。
当社のクローラは、子供向け Web サイトに表示される広告を検出し、利用可能な場合は常に広告開示ページをスクレイピングすることで、広告ターゲティングが有効かどうかを判断します。
私たちの結果によると、子供向け Web サイトの約 90% には 1 つ以上のトラッカーが埋め込まれており、約 27% にはターゲットを絞った広告が含まれており、これには検証可能な保護者の同意が必要です。
次に、広告から抽出された画像とテキストの両方を処理する ML パイプラインを開発することで、子供向け Web サイト上の不適切な広告を特定します。
このパイプラインを使用すると、任意の検索語に対して意味的類似性クエリを実行して、デート、減量、メンタルヘルスに関連するサービスを宣伝する広告を明らかにすることができます。
大人のおもちゃやいちゃつくチャット サービスの広告も含まれます。
これらの広告の中には、不快で露骨な性的画像が含まれているものもあります。
要約すると、私たちの調査結果は、多くの広告主や子供向け Web サイトでプライバシー規制が遵守されておらず、広告の安全性に問題がある傾向があることを示しています。
子どもを保護し、より安全なオンライン環境を構築するために、規制当局と関係者はより厳格な措置を採用し、施行する必要があります。
要約(オリジナル)
On the modern web, trackers and advertisers frequently construct and monetize users’ detailed behavioral profiles without consent. Despite various studies on web tracking mechanisms and advertisements, there has been no rigorous study focusing on websites targeted at children. To address this gap, we present a measurement of tracking and (targeted) advertising on websites directed at children. Motivated by lacking a comprehensive list of child-directed (i.e., targeted at children) websites, we first build a multilingual classifier based on web page titles and descriptions. Applying this classifier to over two million pages, we compile a list of two thousand child-directed websites. Crawling these sites from five vantage points, we measure the prevalence of trackers, fingerprinting scripts, and advertisements. Our crawler detects ads displayed on child-directed websites and determines if ad targeting is enabled by scraping ad disclosure pages whenever available. Our results show that around 90% of child-directed websites embed one or more trackers, and about 27% contain targeted advertisements–a practice that should require verifiable parental consent. Next, we identify improper ads on child-directed websites by developing an ML pipeline that processes both images and text extracted from ads. The pipeline allows us to run semantic similarity queries for arbitrary search terms, revealing ads that promote services related to dating, weight loss, and mental health; as well as ads for sex toys and flirting chat services. Some of these ads feature repulsive and sexually explicit imagery. In summary, our findings indicate a trend of non-compliance with privacy regulations and troubling ad safety practices among many advertisers and child-directed websites. To protect children and create a safer online environment, regulators and stakeholders must adopt and enforce more stringent measures.
arxiv情報
著者 | Zahra Moti,Asuman Senol,Hamid Bostani,Frederik Zuiderveen Borgesius,Veelasha Moonsamy,Arunesh Mathur,Gunes Acar |
発行日 | 2023-08-09 11:37:39+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google