GANzzle: Reframing jigsaw puzzle solving as a retrieval task using a generative mental image

要約

パズルを解くことは、隣接するピースを一致させることが難しいため、組み合わせの課題です。
代わりに、すべてのピースから精神的なイメージを推測します。これにより、特定のピースを組み合わせ爆発の回避と照合できます。
Generative Adversarialメソッドの進歩を利用して、順序付けされていないピースのセットを指定して画像を再構築する方法を学習します。これにより、モデルは、各ピースのエンコーディングをジェネレーターのトリミングされたレイヤーに一致させるジョイント埋め込みスペースを学習できます。
したがって、問題をR @ 1検索タスクとして組み立て、微分可能なハンガリーの注意を使用して線形割り当てを解決し、プロセスをエンドツーエンドにします。
そうすることで、単一サイズである以前の深層学習方法とは対照的に、私たちのモデルはパズルサイズにとらわれません。
2つの新しい大規模データセットで評価します。ここで、モデルはディープラーニング手法と同等であり、複数のパズルサイズに一般化されています。

要約(オリジナル)

Puzzle solving is a combinatorial challenge due to the difficulty of matching adjacent pieces. Instead, we infer a mental image from all pieces, which a given piece can then be matched against avoiding the combinatorial explosion. Exploiting advancements in Generative Adversarial methods, we learn how to reconstruct the image given a set of unordered pieces, allowing the model to learn a joint embedding space to match an encoding of each piece to the cropped layer of the generator. Therefore we frame the problem as a R@1 retrieval task, and then solve the linear assignment using differentiable Hungarian attention, making the process end-to-end. In doing so our model is puzzle size agnostic, in contrast to prior deep learning methods which are single size. We evaluate on two new large-scale datasets, where our model is on par with deep learning methods, while generalizing to multiple puzzle sizes.

arxiv情報

著者 Davide Talon,Alessio Del Bue,Stuart James
発行日 2022-07-12 16:02:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク