TEN: Twin Embedding Networks for the Jigsaw Puzzle Problem with Eroded Boundaries


本論文では、ジグソーパズル問題(JPP)のためのCNNベースのエンコーダTwin Embedding Network (TEN)を紹介する。この潜在的な表現と単純な距離尺度を組み合わせることで、タイル境界が侵食された劣化したパズルに対して、新たに提案するペアワイズ互換性尺度(CM)の精度が、従来の様々な手法に比べて向上することを実証する。この問題は、実世界のシナリオのテストベッドとして適切であるため、本研究では、この問題に焦点を当てました。具体的には、Type-1およびType-2問題に対して、それぞれ最大8.5%、16.8%の再構成精度の向上を実証しました。さらに、TENが一般的なディープニューラルネットワーク(NN)モデルよりも平均して数桁高速であること、すなわち古典的な手法と同程度に高速であることも実証した。この点で、本論文は、実用的な実世界のパズル的問題に対して、(古典的手法の)比較的低い精度と(NNモデルの)集中的な計算量の間のギャップを埋める重要な最初の試みとなるものである。


This paper introduces the novel CNN-based encoder Twin Embedding Network (TEN), for the jigsaw puzzle problem (JPP), which represents a puzzle piece with respect to its boundary in a latent embedding space. Combining this latent representation with a simple distance measure, we demonstrate improved accuracy levels of our newly proposed pairwise compatibility measure (CM), compared to that of various classical methods, for degraded puzzles with eroded tile boundaries. We focus on this problem instance for our case study, as it serves as an appropriate testbed for real-world scenarios. Specifically, we demonstrated an improvement of up to 8.5% and 16.8% in reconstruction accuracy, for so-called Type-1 and Type-2 problem variants, respectively. Furthermore, we also demonstrated that TEN is faster by a few orders of magnitude, on average, than a typical deep neural network (NN) model, i.e., it is as fast as the classical methods. In this regard, the paper makes a significant first attempt at bridging the gap between the relatively low accuracy (of classical methods and the intensive computational complexity (of NN models), for practical, real-world puzzle-like problems.


著者 Daniel Rika,Dror Sholomon,Eli David,Nathan S. Netanyahu
発行日 2022-11-07 18:19:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.LG パーマリンク