要約
今日、画像から画像への翻訳方法は、自然な画像を強調するための最先端技術です。
通常、精度の点で高いパフォーマンスを示しますが、アーティファクトの生成や高解像度へのスケーラビリティなど、いくつかの制限に悩まされることがよくあります。
さらに、それらの主な欠点は、適用された拡張プロセスに関する洞察を最終ユーザーに提供できない完全なブラックボックスアプローチです。
この論文では、ブラックボックスの制限を克服し、最先端の拡張方法によって生成された出力の段階的な説明を提供する経路計画アルゴリズムを提示します。
eXIEと呼ばれるこのアルゴリズムは、A *アルゴリズムの変形を使用して、同等の一連の拡張演算子を適用することにより、別のメソッドの拡張プロセスをエミュレートします。
eXIEを適用して、Five-Kデータセットでトレーニングされたいくつかの最先端モデルの出力を説明し、パフォーマンスの点で非常に類似した結果を生成できる拡張演算子のシーケンスを取得し、解釈可能性の低さという大きな制限を克服しました。
最高のパフォーマンスを発揮するアルゴリズム。
要約(オリジナル)
Nowadays, image-to-image translation methods, are the state of the art for the enhancement of natural images. Even if they usually show high performance in terms of accuracy, they often suffer from several limitations such as the generation of artifacts and the scalability to high resolutions. Moreover, their main drawback is the completely black-box approach that does not allow to provide the final user with any insight about the enhancement processes applied. In this paper we present a path planning algorithm which provides a step-by-step explanation of the output produced by state of the art enhancement methods, overcoming black-box limitation. This algorithm, called eXIE, uses a variant of the A* algorithm to emulate the enhancement process of another method through the application of an equivalent sequence of enhancing operators. We applied eXIE to explain the output of several state-of-the-art models trained on the Five-K dataset, obtaining sequences of enhancing operators able to produce very similar results in terms of performance and overcoming the huge limitation of poor interpretability of the best performing algorithms.
arxiv情報
著者 | Marco Cotogni,Claudio Cusano |
発行日 | 2022-07-14 17:44:49+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google