Self-supervised visual learning for analyzing firearms trafficking activities on the Web

要約

RGB 画像から自動化された視覚的な銃器分類は、公共空間のセキュリティ、情報収集、法執行機関の捜査に応用される重要な現実世界のタスクです。
World Wide Web (ソーシャル メディアやダーク Web サイトを含む) から大量にクロールされた画像に適用すると、オープンソース インテリジェンスからのビッグ データを分析することで、犯罪的な銃器密売ネットワークを特定しようとするシステムの重要なコンポーネントとして機能します。
ディープ ニューラル ネットワーク (DNN) はこれを実現するための最先端の方法論であり、通常は畳み込みニューラル ネットワーク (CNN) が使用されます。
一般的な転移学習アプローチは、ImageNet-1k などの画像全体を分類するための大規模で汎用的な注釈付きデータセットでの事前トレーニングと、視覚的な銃器分類のためのより小規模で注釈付きのタスク固有の下流データセットで DNN を微調整することで構成されます。

Visual Transformer (ViT) ニューラル アーキテクチャも自己教師あり学習 (SSL) アプローチも、これまでのところこの重要なタスクに関して評価されていません。

要約(オリジナル)

Automated visual firearms classification from RGB images is an important real-world task with applications in public space security, intelligence gathering and law enforcement investigations. When applied to images massively crawled from the World Wide Web (including social media and dark Web sites), it can serve as an important component of systems that attempt to identify criminal firearms trafficking networks, by analyzing Big Data from open-source intelligence. Deep Neural Networks (DNN) are the state-of-the-art methodology for achieving this, with Convolutional Neural Networks (CNN) being typically employed. The common transfer learning approach consists of pretraining on a large-scale, generic annotated dataset for whole-image classification, such as ImageNet-1k, and then finetuning the DNN on a smaller, annotated, task-specific, downstream dataset for visual firearms classification. Neither Visual Transformer (ViT) neural architectures nor Self-Supervised Learning (SSL) approaches have been so far evaluated on this critical task..

arxiv情報

著者 Sotirios Konstantakos,Despina Ioanna Chalkiadaki,Ioannis Mademlis,Adamantia Anna Rebolledo Chrysochoou,Georgios Th. Papadopoulos
発行日 2024-02-06 14:40:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク