Efficient Neural Network based Classification and Outlier Detection for Image Moderation using Compressed Sensing and Group Testing


一般的なソーシャルメディアでは、アップロードされた画像に好ましくないコンテンツが含まれている可能性があるとして、ニューラルネットワークベースの画像モデレーションエンジンを採用しています。このようなモデレーションエンジンは、不愉快なコンテンツを含む画像の実際の数はごくわずかであるにもかかわらず、膨大な数のクエリに高い計算コストで答えなければならない。ニューラルネットワークグループテストに関する最近の研究に触発され、我々はこの事実を利用し、圧縮センシング(CS)技術を使用して、このようなエンジンの全体的な計算コストを削減するアプローチを提案する。定量的マトリックスプールニューラルネットワーク(QMPNN)は、入力として$n$画像と、$m<n$の$m \times n$バイナリプーリング行列を受け取り、その行は$n$から$r$画像の選択、すなわちm$画像のプールを表す。QMPNNは、この行列と、各画像が異議ありか否かを示す未知のスパース2値ベクトルとの積を効率的に出力し、すなわち、各プールに含まれる異議あり画像の数を出力する。適切な行列の場合、これをCS復号化アルゴリズムを使って復号化し、どの画像が異議ありだったかを予測する。QMPNNとCSアルゴリズムを実行するための計算コストは、同じ数のパラメータを持つニューラルネットワークを各画像に個別に使用して画像を分類するコストよりも大幅に低く、これは大規模な実験によって実証されています。我々の技術は、QMPNNからの予測における中程度のレベルのエラーに対して本質的に回復力がある。さらに、不快な画像があらかじめ定義されたクラスの集合に属さない場合に対応するため、CSとグループテストの技術を深層外れ値検出に持ち込んだ、プール型深層外れ値検出を提示する。この技術により、ある特定の単一クラスの画像を共有することに特化したトピックフォーラムで共有される話題性のない画像の効率的な自動モデレーションが可能になる。


Popular social media platforms employ neural network based image moderation engines to classify images uploaded on them as having potentially objectionable content. Such moderation engines must answer a large number of queries with heavy computational cost, even though the actual number of images with objectionable content is usually a tiny fraction. Inspired by recent work on Neural Group Testing, we propose an approach which exploits this fact to reduce the overall computational cost of such engines using the technique of Compressed Sensing (CS). We present the quantitative matrix-pooled neural network (QMPNN), which takes as input $n$ images, and a $m \times n$ binary pooling matrix with $m < n$, whose rows indicate $m$ pools of images i.e. selections of $r$ images out of $n$. The QMPNN efficiently outputs the product of this matrix with the unknown sparse binary vector indicating whether each image is objectionable or not, i.e. it outputs the number of objectionable images in each pool. For suitable matrices, this is decoded using CS decoding algorithms to predict which images were objectionable. The computational cost of running the QMPNN and the CS algorithms is significantly lower than the cost of using a neural network with the same number of parameters separately on each image to classify the images, which we demonstrate via extensive experiments. Our technique is inherently resilient to moderate levels of errors in the prediction from the QMPNN. Furthermore, we present pooled deep outlier detection, which brings CS and group testing techniques to deep outlier detection, to provide for the case when the objectionable images do not belong to a set of pre-defined classes. This technique enables efficient automated moderation of off-topic images shared on topical forums dedicated to sharing images of a certain single class, many of which are currently human-moderated.


著者 Sabyasachi Ghosh,Sanyam Saxena,Ajit Rajwade
発行日 2023-05-12 17:48:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.LG パーマリンク