-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
StyleMaster: Stylize Your Video with Artistic Generation and Translation
要約 スタイル コントロールは、ビデオ生成モデルでよく使われてきました。 既存の … 続きを読む
カテゴリー: cs.CV
StyleMaster: Stylize Your Video with Artistic Generation and Translation はコメントを受け付けていません
LoRA3D: Low-Rank Self-Calibration of 3D Geometric Foundation Models
要約 DUSt3R などの新しい 3D 幾何学的基礎モデルは、実際の 3D ビジ … 続きを読む
Multi-Shot Character Consistency for Text-to-Video Generation
要約 Text-to-Video モデルは、テキストの説明から短いビデオ クリッ … 続きを読む
カテゴリー: cs.CV
Multi-Shot Character Consistency for Text-to-Video Generation はコメントを受け付けていません
On Motion Blur and Deblurring in Visual Place Recognition
要約 モバイル ロボット工学における視覚的場所認識 (VPR) を使用すると、ロ … 続きを読む
PortraitTalk: Towards Customizable One-Shot Audio-to-Talking Face Generation
要約 オーディオ主導の話し顔の生成は、デジタル コミュニケーションにおける困難な … 続きを読む
SAT: Spatial Aptitude Training for Multimodal Language Models
要約 空間認識は知能の基本的な要素です。 多くの研究は、大規模なマルチモーダル言 … 続きを読む
3DTrajMaster: Mastering 3D Trajectory for Multi-Entity Motion in Video Generation
要約 この論文は、ビデオ生成においてマルチエンティティ 3D モーションを操作す … 続きを読む
カテゴリー: cs.CV
3DTrajMaster: Mastering 3D Trajectory for Multi-Entity Motion in Video Generation はコメントを受け付けていません
SynCamMaster: Synchronizing Multi-Camera Video Generation from Diverse Viewpoints
要約 ビデオ拡散モデルの最近の進歩により、現実世界のダイナミクスをシミュレートし … 続きを読む
カテゴリー: cs.CV
SynCamMaster: Synchronizing Multi-Camera Video Generation from Diverse Viewpoints はコメントを受け付けていません
Repurposing Pre-trained Video Diffusion Models for Event-based Video Interpolation
要約 ビデオ フレーム補間は、観察されたフレーム間の現実的な欠落フレームを回復し … 続きを読む
カテゴリー: cs.CV
Repurposing Pre-trained Video Diffusion Models for Event-based Video Interpolation はコメントを受け付けていません
Make-A-Texture: Fast Shape-Aware Texture Generation in 3 Seconds
要約 与えられた 3D ジオメトリのテキスト プロンプトから高解像度のテクスチャ … 続きを読む