SAMScore: A Semantic Structural Similarity Metric for Image Translation Evaluation


このギャップを埋めるために、画像翻訳モデルの忠実性を評価するための一般的な意味構造類似性メトリクスである SAMScore を導入します。
SAMScore は、優れた精度でセマンティック類似性比較を実行できる、最近の高性能セグメント エニシング モデル (SAM) に基づいています。
SAMScore を 19 の画像翻訳タスクに適用したところ、すべてのタスクで他の競合指標を上回るパフォーマンスを発揮できることがわかりました。
私たちは、SAMScore が、新しく進化する翻訳モデルのより正確な評価を可能にすることで、画像翻訳の活気に満ちた分野を推進するのに役立つ貴重なツールとなることを期待しています。
コードは で入手できます。


Image translation has wide applications, such as style transfer and modality conversion, usually aiming to generate images having both high degrees of realism and faithfulness. These problems remain difficult, especially when it is important to preserve semantic structures. Traditional image-level similarity metrics are of limited use, since the semantics of an image are high-level, and not strongly governed by pixel-wise faithfulness to an original image. Towards filling this gap, we introduce SAMScore, a generic semantic structural similarity metric for evaluating the faithfulness of image translation models. SAMScore is based on the recent high-performance Segment Anything Model (SAM), which can perform semantic similarity comparisons with standout accuracy. We applied SAMScore on 19 image translation tasks, and found that it is able to outperform all other competitive metrics on all of the tasks. We envision that SAMScore will prove to be a valuable tool that will help to drive the vibrant field of image translation, by allowing for more precise evaluations of new and evolving translation models. The code is available at


著者 Yunxiang Li,Meixu Chen,Wenxuan Yang,Kai Wang,Jun Ma,Alan C. Bovik,You Zhang
発行日 2023-05-24 17:22:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CV パーマリンク