-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
LOCATEdit: Graph Laplacian Optimized Cross Attention for Localized Text-Guided Image Editing
要約 テキスト誘導画像編集は、一般的な構造と背景の忠実度を維持しながら、自然言語 … 続きを読む
Generalizable Prompt Learning of CLIP: A Brief Overview
要約 クリップなどの既存のビジョン言語モデル(VLM)は、さまざまな下流タスクに … 続きを読む
Unified Multimodal Discrete Diffusion
要約 複数のモダリティにわたって理解して生成できるマルチモーダル生成モデルは、左 … 続きを読む
SimBEV: A Synthetic Multi-Task Multi-Sensor Driving Data Generation Tool and Dataset
要約 BEV表現がマルチモーダルセンサーの融合を促進するため、Bird̵ … 続きを読む
SyncDiff: Synchronized Motion Diffusion for Multi-Body Human-Object Interaction Synthesis
要約 現実的な人間とオブジェクトの相互作用の動きを統合することは、VR/ARと人 … 続きを読む
UGNA-VPR: A Novel Training Paradigm for Visual Place Recognition Based on Uncertainty-Guided NeRF Augmentation
要約 視覚的な場所認識(VPR)は、ロボットが以前に訪れた場所を特定するために重 … 続きを読む
STAMICS: Splat, Track And Map with Integrated Consistency and Semantics for Dense RGB-D SLAM
要約 同時ローカリゼーションとマッピング(SLAM)は、ロボット工学の重要なタス … 続きを読む
How NeRFs and 3D Gaussian Splatting are Reshaping SLAM: a Survey
要約 過去20年にわたって、同時ローカリゼーションとマッピング(SLAM)の分野 … 続きを読む
SyncSDE: A Probabilistic Framework for Diffusion Synchronization
要約 元のドメインを超えて拡張するために、共同生成のために複数の拡散モデルを活用 … 続きを読む
Generalizable Prompt Learning of CLIP: A Brief Overview
要約 クリップなどの既存のビジョン言語モデル(VLM)は、さまざまな下流タスクに … 続きを読む