要約
本稿では、トランスフォーマベースの学習画像圧縮システムを提案する。
関心領域 (ROI) 機能をサポートしながら、単一のモデルで可変レート圧縮を実現できます。
プロンプト チューニングからインスピレーションを得て、トランスベースの圧縮オートエンコーダーを調整するプロンプト生成ネットワークを導入します。
当社のプロンプト生成ネットワークは、入力画像、ROI マスク、レート パラメーターに従ってコンテンツ アダプティブ トークンを生成します。
ROI マスクとレート パラメーターを分離することで、直感的な方法で可変レートと ROI コーディングを同時に実現できます。
広範な実験により、私たちが提案した方法の有効性が検証され、他の競合方法に対するその優位性が確認されています。
要約(オリジナル)
This paper proposes a transformer-based learned image compression system. It is capable of achieving variable-rate compression with a single model while supporting the region-of-interest (ROI) functionality. Inspired by prompt tuning, we introduce prompt generation networks to condition the transformer-based autoencoder of compression. Our prompt generation networks generate content-adaptive tokens according to the input image, an ROI mask, and a rate parameter. The separation of the ROI mask and the rate parameter allows an intuitive way to achieve variable-rate and ROI coding simultaneously. Extensive experiments validate the effectiveness of our proposed method and confirm its superiority over the other competing methods.
arxiv情報
著者 | Chia-Hao Kao,Ying-Chieh Weng,Yi-Hsin Chen,Wei-Chen Chiu,Wen-Hsiao Peng |
発行日 | 2023-08-01 10:12:42+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google