cs.CV」カテゴリーアーカイブ

Visual Style Prompt Learning Using Diffusion Models for Blind Face Restoration

要約 ブラインドフェイス復元は、さまざまな未確認の劣化源から高品質の顔画像を復元 … 続きを読む

カテゴリー: 68U10, cs.CV, cs.MM, I.4.3 | Visual Style Prompt Learning Using Diffusion Models for Blind Face Restoration はコメントを受け付けていません

E2EDiff: Direct Mapping from Noise to Data for Enhanced Diffusion Models

要約 拡散モデルは、生成モデリングの強力なフレームワークとして登場し、さまざまな … 続きを読む

カテゴリー: cs.CV | E2EDiff: Direct Mapping from Noise to Data for Enhanced Diffusion Models はコメントを受け付けていません

VisionReward: Fine-Grained Multi-Dimensional Human Preference Learning for Image and Video Generation

要約 我々は、視覚生成モデル (画像生成とビデオ生成の両方) を人間の好みに合わ … 続きを読む

カテゴリー: cs.CV | VisionReward: Fine-Grained Multi-Dimensional Human Preference Learning for Image and Video Generation はコメントを受け付けていません

Varformer: Adapting VAR’s Generative Prior for Image Restoration

要約 広範な高品質データセットでトレーニングされた生成モデルは、きれいな画像の構 … 続きを読む

カテゴリー: cs.CV | Varformer: Adapting VAR’s Generative Prior for Image Restoration はコメントを受け付けていません

Edicho: Consistent Image Editing in the Wild

要約 ニーズが実証されているため、実際の画像全体で一貫した編集を行うことは、オブ … 続きを読む

カテゴリー: cs.CV | Edicho: Consistent Image Editing in the Wild はコメントを受け付けていません

Vinci: A Real-time Embodied Smart Assistant based on Egocentric Vision-Language Model

要約 私たちは、自己中心的な視覚言語モデルに基づいて構築されたリアルタイムの具体 … 続きを読む

カテゴリー: cs.CV | Vinci: A Real-time Embodied Smart Assistant based on Egocentric Vision-Language Model はコメントを受け付けていません

Prometheus: 3D-Aware Latent Diffusion Models for Feed-Forward Text-to-3D Scene Generation

要約 この研究では、オブジェクト レベルとシーン レベルの両方で数秒でテキストか … 続きを読む

カテゴリー: cs.CV | Prometheus: 3D-Aware Latent Diffusion Models for Feed-Forward Text-to-3D Scene Generation はコメントを受け付けていません

What Makes for a Good Stereoscopic Image?

要約 仮想現実 (VR) ヘッドセットの急速な進歩により、没入型で快適な 3D … 続きを読む

カテゴリー: cs.CV | What Makes for a Good Stereoscopic Image? はコメントを受け付けていません

A Large-Scale Study on Video Action Dataset Condensation

要約 データセットの圧縮は、画像領域で大幅に進歩しました。 画像とは異なり、ビデ … 続きを読む

カテゴリー: cs.CV | A Large-Scale Study on Video Action Dataset Condensation はコメントを受け付けていません

Action-Agnostic Point-Level Supervision for Temporal Action Detection

要約 軽く注釈を付けたデータセットで正確なアクションインスタンスの検出を実現する … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Action-Agnostic Point-Level Supervision for Temporal Action Detection はコメントを受け付けていません