-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Infinite Mobility: Scalable High-Fidelity Synthesis of Articulated Objects via Procedural Generation
要約 具体化されたAIに関連する複数のタスクには、高品質の大規模な明確なオブジェ … 続きを読む
カテゴリー: cs.CV
Infinite Mobility: Scalable High-Fidelity Synthesis of Articulated Objects via Procedural Generation はコメントを受け付けていません
Robust Latent Matters: Boosting Image Generation with Sampling Error Synthesis
要約 通常、最近の画像生成スキームは、凍結画像トークネイザーに依存して、事前に構 … 続きを読む
Escaping Plato’s Cave: Robust Conceptual Reasoning through Interpretable 3D Neural Object Volumes
要約 特にハイステークスアプリケーションでのニューラルネットワークの増加に伴い、 … 続きを読む
カテゴリー: cs.CV
Escaping Plato’s Cave: Robust Conceptual Reasoning through Interpretable 3D Neural Object Volumes はコメントを受け付けていません
AugMapNet: Improving Spatial Latent Structure via BEV Grid Augmentation for Enhanced Vectorized Online HD Map Construction
要約 自律運転には、レーンや横断歩道などのインフラストラクチャ要素を理解する必要 … 続きを読む
Less Biased Noise Scale Estimation for Threshold-Robust RANSAC
要約 画像マッチングを通じて相対的なポーズを堅牢に推定するための金標準はRANS … 続きを読む
カテゴリー: cs.CV
Less Biased Noise Scale Estimation for Threshold-Robust RANSAC はコメントを受け付けていません
BlobCtrl: A Unified and Flexible Framework for Element-level Image Generation and Editing
要約 要素レベルの視覚操作はデジタルコンテンツの作成に不可欠ですが、現在の拡散ベ … 続きを読む
WideRange4D: Enabling High-Quality 4D Reconstruction with Wide-Range Movements and Scenes
要約 3D再建技術の急速な発展により、4D再建の研究も進歩しています。既存の4D … 続きを読む
カテゴリー: cs.CV
WideRange4D: Enabling High-Quality 4D Reconstruction with Wide-Range Movements and Scenes はコメントを受け付けていません
Unified Autoregressive Visual Generation and Understanding with Continuous Tokens
要約 共同視覚生成と連続的な視覚トークンの活用を理解するための統一された自己回帰 … 続きを読む
MaTVLM: Hybrid Mamba-Transformer for Efficient Vision-Language Modeling
要約 線形の複雑さを伴うRNNモデルの進歩により、変圧器の二次複雑さの課題は克服 … 続きを読む
カテゴリー: cs.CV
MaTVLM: Hybrid Mamba-Transformer for Efficient Vision-Language Modeling はコメントを受け付けていません
Amodal3R: Amodal 3D Reconstruction from Occluded 2D Images
要約 ほとんどの画像ベースの3Dオブジェクトリクストラクターは、実際のシナリオで … 続きを読む
カテゴリー: cs.CV
Amodal3R: Amodal 3D Reconstruction from Occluded 2D Images はコメントを受け付けていません