「cs.CV」カテゴリーアーカイブ

StyleMaster: Stylize Your Video with Artistic Generation and Translation

投稿日: 2024年12月11日作成者: jarxiv

要約スタイルコントロールは、ビデオ生成モデルでよく使われてきました。既存の … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

LoRA3D: Low-Rank Self-Calibration of 3D Geometric Foundation Models

投稿日: 2024年12月11日作成者: jarxiv

要約 DUSt3R などの新しい 3D 幾何学的基礎モデルは、実際の 3D ビジ … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Multi-Shot Character Consistency for Text-to-Video Generation

投稿日: 2024年12月11日作成者: jarxiv

要約 Text-to-Video モデルは、テキストの説明から短いビデオクリッ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

On Motion Blur and Deblurring in Visual Place Recognition

投稿日: 2024年12月11日作成者: jarxiv

要約モバイルロボット工学における視覚的場所認識 (VPR) を使用すると、ロ … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

PortraitTalk: Towards Customizable One-Shot Audio-to-Talking Face Generation

投稿日: 2024年12月11日作成者: jarxiv

要約オーディオ主導の話し顔の生成は、デジタルコミュニケーションにおける困難な … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

SAT: Spatial Aptitude Training for Multimodal Language Models

投稿日: 2024年12月11日作成者: jarxiv

要約空間認識は知能の基本的な要素です。多くの研究は、大規模なマルチモーダル言 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR, cs.RO | コメントを受け付けていません

3DTrajMaster: Mastering 3D Trajectory for Multi-Entity Motion in Video Generation

投稿日: 2024年12月11日作成者: jarxiv

要約この論文は、ビデオ生成においてマルチエンティティ 3D モーションを操作す … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

SynCamMaster: Synchronizing Multi-Camera Video Generation from Diverse Viewpoints

投稿日: 2024年12月11日作成者: jarxiv

要約ビデオ拡散モデルの最近の進歩により、現実世界のダイナミクスをシミュレートし … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Repurposing Pre-trained Video Diffusion Models for Event-based Video Interpolation

投稿日: 2024年12月11日作成者: jarxiv

要約ビデオフレーム補間は、観察されたフレーム間の現実的な欠落フレームを回復し … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Make-A-Texture: Fast Shape-Aware Texture Generation in 3 Seconds

投稿日: 2024年12月11日作成者: jarxiv

要約与えられた 3D ジオメトリのテキストプロンプトから高解像度のテクスチャ … 続きを読む →

カテゴリー: cs.CV, cs.GR | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

StyleMaster: Stylize Your Video with Artistic Generation and Translation

LoRA3D: Low-Rank Self-Calibration of 3D Geometric Foundation Models

Multi-Shot Character Consistency for Text-to-Video Generation

On Motion Blur and Deblurring in Visual Place Recognition

PortraitTalk: Towards Customizable One-Shot Audio-to-Talking Face Generation

SAT: Spatial Aptitude Training for Multimodal Language Models

3DTrajMaster: Mastering 3D Trajectory for Multi-Entity Motion in Video Generation

SynCamMaster: Synchronizing Multi-Camera Video Generation from Diverse Viewpoints

Repurposing Pre-trained Video Diffusion Models for Event-based Video Interpolation

Make-A-Texture: Fast Shape-Aware Texture Generation in 3 Seconds

最近の投稿

最近のコメント

アーカイブ

カテゴリー