-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Socratic Planner: Self-QA-Based Zero-Shot Planning for Embodied Instruction Following
要約 次の具体化された命令(EIF)は、インタラクティブな環境でオブジェクトをナ … 続きを読む
VideoGEM: Training-free Action Grounding in Videos
要約 Vision-Language Foundationモデルは、主に画像のオ … 続きを読む
VPO: Aligning Text-to-Video Generation Models with Prompt Optimization
要約 ビデオ生成モデルは、テキストからビデオへのタスクで顕著な進歩を達成していま … 続きを読む
Contrastive Learning Guided Latent Diffusion Model for Image-to-Image Translation
要約 拡散モデルは、テキスト誘導画像翻訳のための多様で高品質の画像の合成において … 続きを読む
Towards End-to-End Neuromorphic Voxel-based 3D Object Reconstruction Without Physical Priors
要約 イベントカメラとも呼ばれる神経型カメラは、モーションブラーに苦しむことなく … 続きを読む
Fantastic Copyrighted Beasts and How (Not) to Generate Them
要約 最近の研究では、画像とビデオ生成モデルをトレーニングデータから著作権で保護 … 続きを読む
Bayesian Modeling of Zero-Shot Classifications for Urban Flood Detection
要約 ストリートビューまたはダッシュボードカメラから収集されたストリートシーンの … 続きを読む
Towards Efficient and General-Purpose Few-Shot Misclassification Detection for Vision-Language Models
要約 分類器による信頼できる予測は、セキュリティが高く、動的に変化する状況での展 … 続きを読む
GAIA-2: A Controllable Multi-View Generative World Model for Autonomous Driving
要約 生成モデルは、複雑な環境をシミュレートするためのスケーラブルで柔軟なパラダ … 続きを読む
PG-SAM: Prior-Guided SAM with Medical for Multi-organ Segmentation
要約 セグメントAnything Model(SAM)は、強力なゼロショット機能 … 続きを読む