-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Four-Plane Factorized Video Autoencoders
要約 潜在変数生成モデルは、画像やビデオの合成などの生成タスクのための強力なツー … 続きを読む
カテゴリー: cs.CV
Four-Plane Factorized Video Autoencoders はコメントを受け付けていません
Code-as-Monitor: Constraint-aware Visual Programming for Reactive and Proactive Robotic Failure Detection
要約 オープンセット障害の自動検出と防止は、閉ループロボットシステムにおいて非常 … 続きを読む
Switti: Designing Scale-Wise Transformers for Text-to-Image Synthesis
要約 この作品では、テキストから画像を生成するためのスケールワイズ トランスフォ … 続きを読む
カテゴリー: cs.CV
Switti: Designing Scale-Wise Transformers for Text-to-Image Synthesis はコメントを受け付けていません
HeatFormer: A Neural Optimizer for Multiview Human Mesh Recovery
要約 複数の静的ビューを完全に活用できる、人間の形状と姿勢を復元するための新しい … 続きを読む
カテゴリー: cs.CV
HeatFormer: A Neural Optimizer for Multiview Human Mesh Recovery はコメントを受け付けていません
Monocular Dynamic Gaussian Splatting is Fast and Brittle but Smooth Motion Helps
要約 ガウス スプラッティング法は、マルチビュー画像データをビュー合成を可能にす … 続きを読む
カテゴリー: cs.CV
Monocular Dynamic Gaussian Splatting is Fast and Brittle but Smooth Motion Helps はコメントを受け付けていません
Cubify Anything: Scaling Indoor 3D Object Detection
要約 市販のハンドヘルド デバイスから取得した単一の RGB(-D) フレームに … 続きを読む
カテゴリー: cs.CV
Cubify Anything: Scaling Indoor 3D Object Detection はコメントを受け付けていません
Sparse Voxels Rasterization: Real-time High-fidelity Radiance Field Rendering
要約 私たちは、ニューラル ネットワークや 3D ガウスを使用せずに、まばらなボ … 続きを読む
LayerFusion: Harmonized Multi-Layer Text-to-Image Generation with Generative Priors
要約 大規模拡散モデルは、テキストの説明から高品質の画像を生成することに目覚まし … 続きを読む
カテゴリー: cs.CV
LayerFusion: Harmonized Multi-Layer Text-to-Image Generation with Generative Priors はコメントを受け付けていません
4Real-Video: Learning Generalizable Photo-Realistic 4D Video Diffusion
要約 私たちは、時間軸と視点軸の両方を持つビデオ フレームのグリッドとして編成さ … 続きを読む
カテゴリー: cs.CV
4Real-Video: Learning Generalizable Photo-Realistic 4D Video Diffusion はコメントを受け付けていません
MegaSaM: Accurate, Fast, and Robust Structure and Motion from Casual Dynamic Videos
要約 動的シーンのカジュアルな単眼ビデオからカメラパラメータと深度マップを正確、 … 続きを読む
カテゴリー: cs.CV
MegaSaM: Accurate, Fast, and Robust Structure and Motion from Casual Dynamic Videos はコメントを受け付けていません