要約
ソーシャルメディア、ウェブブラウジング、ビデオストリーミングに牽引されたインターネットの急速な成長により、画像はウェブ体験の中心的存在となり、その結果、データ転送量が増大し、ウェブページのサイズが大きくなっています。従来の画像圧縮方法は、帯域幅を削減する一方で、しばしば画質を劣化させる。本論文では、エッジまたはクライアントサイドで画像を再構成するために、生成AIを使用した新しいアプローチを探求する。テキストプロンプトを活用するフレームワークを開発し、キャニーエッジやカラーパレットなどの追加条件入力をテキスト-画像モデルに提供することで、高い知覚的類似性を維持しながら、最良の場合で最大99.8%、平均で92.6%の帯域幅削減を達成する。経験的分析とユーザー調査により、我々の方法は従来の圧縮方法よりも効果的に画像の意味と構造を保持し、画質の劣化を最小限に抑えながら帯域幅の使用量を削減し、インターネットのアフォーダビリティを向上させる有望なソリューションを提供することが示された。
要約(オリジナル)
The rapid growth of the Internet, driven by social media, web browsing, and video streaming, has made images central to the Web experience, resulting in significant data transfer and increased webpage sizes. Traditional image compression methods, while reducing bandwidth, often degrade image quality. This paper explores a novel approach using generative AI to reconstruct images at the edge or client-side. We develop a framework that leverages text prompts and provides additional conditioning inputs like Canny edges and color palettes to a text-to-image model, achieving up to 99.8% bandwidth savings in the best cases and 92.6% on average, while maintaining high perceptual similarity. Empirical analysis and a user study show that our method preserves image meaning and structure more effectively than traditional compression methods, offering a promising solution for reducing bandwidth usage and improving Internet affordability with minimal degradation in image quality.
arxiv情報
著者 | Shayan Ali Hassan,Danish Humair,Ihsan Ayyub Qazi,Zafar Ayyub Qazi |
発行日 | 2024-07-05 14:29:12+00:00 |
arxivサイト | arxiv_id(pdf) |