When the Few Outweigh the Many: Illicit Content Recognition with Few-Shot Learning

要約

ダークウェブの匿名性と追跡不能の利点は、現在までに多くの違法行為に適した子宮を作り出しながら、その人気が飛躍的に高まる可能性を説明しています。
したがって、サイバーセキュリティおよび法執行機関と協力して、テキストのダークウェブ市場のコンテンツ認識を最も悪用した違法行為を認識および分類するためのアプローチを研究が提供しました。
ダークウェブコンテンツから生成された画像を使用するそのようなアプローチはほとんどありません。
この論文では、画像から違法行為を認識するためのこの代替技術を調査します。
特に、この分野の最先端のアプローチであるシャム ニューラル ネットワークの使用を特徴とするワンショット学習やフューショット学習などのラベルに依存しない学習手法を調査します。
私たちのソリューションは、小規模なデータセットを確実な精度で処理できます。
特に、シャム ニューラル ネットワークは、10 クラスのデータセットに対する 20 ショット実験で 90.9% に達します。
このことから、このようなモデルは、ダークウェブ上の自動法執行機械の定義に代わる、有望で安価な代替手段であるとの結論に至りました。

要約(オリジナル)

The anonymity and untraceability benefits of the Dark web account for the exponentially-increased potential of its popularity while creating a suitable womb for many illicit activities, to date. Hence, in collaboration with cybersecurity and law enforcement agencies, research has provided approaches for recognizing and classifying illicit activities with most exploiting textual dark web markets’ content recognition; few such approaches use images that originated from dark web content. This paper investigates this alternative technique for recognizing illegal activities from images. In particular, we investigate label-agnostic learning techniques like One-Shot and Few-Shot learning featuring the use Siamese neural networks, a state-of-the-art approach in the field. Our solution manages to handle small-scale datasets with promising accuracy. In particular, Siamese neural networks reach 90.9% on 20-Shot experiments over a 10-class dataset; this leads us to conclude that such models are a promising and cheaper alternative to the definition of automated law-enforcing machinery over the dark web.

arxiv情報

著者 G. Cascavilla,G. Catolino,M. Conti,D. Mellios,D. A. Tamburri
発行日 2023-11-28 18:28:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CR, cs.CV, cs.CY, cs.LG パーマリンク