Edge2Vec: A High Quality Embedding for the Jigsaw Puzzle Problem

要約

ペアワイズ互換性測定 (CM) は、ジグソー パズル問題 (JPP) と、最近提案されたその変形の多くを解決する上で重要な要素です。
ディープ ニューラル ネットワーク (DNN) の急速な普及に伴い、パフォーマンス (つまり精度) と計算効率のトレードオフが非常に重要な問題になっています。
エンド ツー エンドの DNN ベースの CM モデルは高いパフォーマンスを発揮しますが、非常に集中的な計算のために、非常に大きなパズルでは事実上実行不可能になります。
一方、最近の研究によると、埋め込みの概念を利用して計算効率を大幅に軽減すると、パフォーマンスが低下することがわかっています。
この論文では、速度と精度の間の上記のギャップを埋めるための高度な CM モデル (修正された埋め込みと、ハード バッチ トリプレット損失と呼ばれる新しい損失関数に基づく) を導出します。
つまり、パフォーマンスと効率の組み合わせに関して SOTA の結果を達成する CM モデルです。
新しく派生した CM を 3 つの一般的に使用されるデータセットで評価し、以前の CM による既知の最良の結果と比較して、いわゆるタイプ 1 およびタイプ 2 の問題バリアントでそれぞれ 5.8% および 19.5% の再構成の改善を得ました。

要約(オリジナル)

Pairwise compatibility measure (CM) is a key component in solving the jigsaw puzzle problem (JPP) and many of its recently proposed variants. With the rapid rise of deep neural networks (DNNs), a trade-off between performance (i.e., accuracy) and computational efficiency has become a very significant issue. Whereas an end-to-end DNN-based CM model exhibits high performance, it becomes virtually infeasible on very large puzzles, due to its highly intensive computation. On the other hand, exploiting the concept of embeddings to alleviate significantly the computational efficiency, has resulted in degraded performance, according to recent studies. This paper derives an advanced CM model (based on modified embeddings and a new loss function, called hard batch triplet loss) for closing the above gap between speed and accuracy; namely a CM model that achieves SOTA results in terms of performance and efficiency combined. We evaluated our newly derived CM on three commonly used datasets, and obtained a reconstruction improvement of 5.8% and 19.5% for so-called Type-1 and Type-2 problem variants, respectively, compared to best known results due to previous CMs.

arxiv情報

著者 Daniel Rika,Dror Sholomon,Eli David,Nathan S. Netanyahu
発行日 2022-12-22 18:08:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク