Effects of Data Enrichment with Image Transformations on the Performance of Deep Networks

要約

画像が常に特定の標準形式と方向で提供されるとは限りません。
ディープネットワークは、向きや形式の予期せぬ変化を考慮するようにトレーニングする必要があります。
この目的のために、トレーニング データを強化してさまざまな条件を含める必要があります。
この研究では、超解像問題におけるディープネットワークのパフォーマンスに対するデータエンリッチメントの影響を実験的に調査しました。
強化手順には、合計 6 つの基本的な画像変換が使用されました。
実験では、これら 6 つの画像変換プロセスによって強化された ILSVRC2012 データセットのバリアントを使用して 2 つのディープ ネットワーク モデルをトレーニングしました。
単一の画像変換を考慮すると、180 度回転で強化されたデータが最良の結果を提供することが観察されています。
最も失敗した結果は、反転プロセスによって生成された強化されたデータでモデルがトレーニングされたときに得られました。
モデルは、すべての変換を組み合わせてトレーニングした場合に最も高いスコアを獲得しました。

要約(オリジナル)

Images cannot always be expected to come in a certain standard format and orientation. Deep networks need to be trained to take into account unexpected variations in orientation or format. For this purpose, training data should be enriched to include different conditions. In this study, the effects of data enrichment on the performance of deep networks in the super resolution problem were investigated experimentally. A total of six basic image transformations were used for the enrichment procedures. In the experiments, two deep network models were trained with variants of the ILSVRC2012 dataset enriched by these six image transformation processes. Considering a single image transformation, it has been observed that the data enriched with 180 degree rotation provides the best results. The most unsuccessful result was obtained when the models were trained on the enriched data generated by the flip upside down process. Models scored highest when trained with a mix of all transformations.

arxiv情報

著者 Hakan Temiz
発行日 2023-06-13 12:22:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク