cs.CV」カテゴリーアーカイブ

StyleMaster: Stylize Your Video with Artistic Generation and Translation

要約 スタイル コントロールは、ビデオ生成モデルでよく使われてきました。 既存の … 続きを読む

カテゴリー: cs.CV | StyleMaster: Stylize Your Video with Artistic Generation and Translation はコメントを受け付けていません

LoRA3D: Low-Rank Self-Calibration of 3D Geometric Foundation Models

要約 DUSt3R などの新しい 3D 幾何学的基礎モデルは、実際の 3D ビジ … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | LoRA3D: Low-Rank Self-Calibration of 3D Geometric Foundation Models はコメントを受け付けていません

Multi-Shot Character Consistency for Text-to-Video Generation

要約 Text-to-Video モデルは、テキストの説明から短いビデオ クリッ … 続きを読む

カテゴリー: cs.CV | Multi-Shot Character Consistency for Text-to-Video Generation はコメントを受け付けていません

On Motion Blur and Deblurring in Visual Place Recognition

要約 モバイル ロボット工学における視覚的場所認識 (VPR) を使用すると、ロ … 続きを読む

カテゴリー: cs.CV, eess.IV | On Motion Blur and Deblurring in Visual Place Recognition はコメントを受け付けていません

PortraitTalk: Towards Customizable One-Shot Audio-to-Talking Face Generation

要約 オーディオ主導の話し顔の生成は、デジタル コミュニケーションにおける困難な … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | PortraitTalk: Towards Customizable One-Shot Audio-to-Talking Face Generation はコメントを受け付けていません

SAT: Spatial Aptitude Training for Multimodal Language Models

要約 空間認識は知能の基本的な要素です。 多くの研究は、大規模なマルチモーダル言 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.RO | SAT: Spatial Aptitude Training for Multimodal Language Models はコメントを受け付けていません

3DTrajMaster: Mastering 3D Trajectory for Multi-Entity Motion in Video Generation

要約 この論文は、ビデオ生成においてマルチエンティティ 3D モーションを操作す … 続きを読む

カテゴリー: cs.CV | 3DTrajMaster: Mastering 3D Trajectory for Multi-Entity Motion in Video Generation はコメントを受け付けていません

SynCamMaster: Synchronizing Multi-Camera Video Generation from Diverse Viewpoints

要約 ビデオ拡散モデルの最近の進歩により、現実世界のダイナミクスをシミュレートし … 続きを読む

カテゴリー: cs.CV | SynCamMaster: Synchronizing Multi-Camera Video Generation from Diverse Viewpoints はコメントを受け付けていません

Repurposing Pre-trained Video Diffusion Models for Event-based Video Interpolation

要約 ビデオ フレーム補間は、観察されたフレーム間の現実的な欠落フレームを回復し … 続きを読む

カテゴリー: cs.CV | Repurposing Pre-trained Video Diffusion Models for Event-based Video Interpolation はコメントを受け付けていません

Make-A-Texture: Fast Shape-Aware Texture Generation in 3 Seconds

要約 与えられた 3D ジオメトリのテキスト プロンプトから高解像度のテクスチャ … 続きを読む

カテゴリー: cs.CV, cs.GR | Make-A-Texture: Fast Shape-Aware Texture Generation in 3 Seconds はコメントを受け付けていません