Learning Partial Correlation based Deep Visual Representation for Image Classification

要約

タイトル:画像分類のための部分相関ベースの深層ビジュアル表現の学習
要約:

– 共分散行列に基づくビジュアル表現は、畳み込み特徴マップ内の異なるチャネル間のペアワイズ相関を特徴付けることによって、画像分類においてその効果を発揮しています。
– ただし、別のチャンネルが両方の興味のあるチャンネルに相関する場合、「混同効果」が生じ、ペアワイズ相関は誤解につながることがあります。この場合、「混同効果」を取り除く「部分相関」が推定される必要があります。
– ただし、部分相関を信頼して推定するには、疎行列逆共分散推定(SICE)として知られる対称正定値行列最適化を解決する必要があります。このプロセスをCNNにどのように組み込むかは、未解決の問題です。
– この研究では、SICEをCNNの新しい構造化レイヤーとして定式化します。エンドツーエンドのトレーニングを確保するために、上記の行列最適化を順方向および逆方向伝播のステップ中に解決する反復法を開発しました。
– この研究の成果により、部分相関に基づく深層ビジュアル表現が得られ、CNNにおける共分散行列推定時にしばしば遭遇する少ないサンプルの問題を軽減しました。計算上、モデルはGPUで効果的にトレーニングでき、高度なCNNの多数のチャンネルに適しています。
– 実験により、共分散行列に基づく対照的な深層ビジュアル表現と比較して、当該研究の深層ビジュアル表現が効果的であり、優れた分類性能を発揮することが示されています。

要約(オリジナル)

Visual representation based on covariance matrix has demonstrates its efficacy for image classification by characterising the pairwise correlation of different channels in convolutional feature maps. However, pairwise correlation will become misleading once there is another channel correlating with both channels of interest, resulting in the “confounding” effect. For this case, “partial correlation” which removes the confounding effect shall be estimated instead. Nevertheless, reliably estimating partial correlation requires to solve a symmetric positive definite matrix optimisation, known as sparse inverse covariance estimation (SICE). How to incorporate this process into CNN remains an open issue. In this work, we formulate SICE as a novel structured layer of CNN. To ensure end-to-end trainability, we develop an iterative method to solve the above matrix optimisation during forward and backward propagation steps. Our work obtains a partial correlation based deep visual representation and mitigates the small sample problem often encountered by covariance matrix estimation in CNN. Computationally, our model can be effectively trained with GPU and works well with a large number of channels of advanced CNNs. Experiments show the efficacy and superior classification performance of our deep visual representation compared to covariance matrix based counterparts.

arxiv情報

著者 Saimunur Rahman,Piotr Koniusz,Lei Wang,Luping Zhou,Peyman Moghadam or Changming Sun
発行日 2023-04-23 10:09:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク