要約
畳み込みニューラル ネットワーク (CNN) を、消費者の写真の正しい方向 (0、90、180、270 度から) を決定するというコンテキストでの画像方向検出の問題に適用します。
この問題は、アナログ写真をデジタル化する場合に特に重要です。
標準データセットの 1 つでのパフォーマンスの点で、公開されている最先端技術を大幅に改善し、より困難な消費者写真の大規模データセットでシステムをテストします。
CNN が写真の向きをどのように検出するかについての洞察を取得し、その間違いを説明するために、ガイド付きバックプロパゲーションを使用します。
要約(オリジナル)
We apply convolutional neural networks (CNN) to the problem of image orientation detection in the context of determining the correct orientation (from 0, 90, 180, and 270 degrees) of a consumer photo. The problem is especially important for digitazing analog photographs. We substantially improve on the published state of the art in terms of the performance on one of the standard datasets, and test our system on a more difficult large dataset of consumer photos. We use Guided Backpropagation to obtain insights into how our CNN detects photo orientation, and to explain its mistakes.
arxiv情報
著者 | Michael Guerzhoy,Ujash Joshi |
発行日 | 2023-05-17 16:00:49+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google