-
最近の投稿
- Towards Generalizable Vision-Language Robotic Manipulation: A Benchmark and LLM-guided 3D Policy
- Haptic-ACT: Bridging Human Intuition with Compliant Robotic Manipulation via Immersive VR
- Task-Aware Robotic Grasping by evaluating Quality Diversity Solutions through Foundation Models
- VDT-Auto: End-to-end Autonomous Driving with VLM-Guided Diffusion Transformers
- ViViDex: Learning Vision-based Dexterous Manipulation from Human Videos
-
最近のコメント
表示できるコメントはありません。 cs.AI (34550) cs.CL (26107) cs.CR (2648) cs.CV (40394) cs.LG (39550) cs.RO (20191) cs.SY (3066) eess.IV (4803) eess.SY (3060) stat.ML (5206)
月別アーカイブ: 2023年1月
SeaFormer: Squeeze-enhanced Axial Transformer for Mobile Semantic Segmentation
要約 ビジョン トランスフォーマーの導入以来、CNN によって圧倒的に支配されて … 続きを読む
カテゴリー: cs.CV
SeaFormer: Squeeze-enhanced Axial Transformer for Mobile Semantic Segmentation はコメントを受け付けていません
ESC: Exploration with Soft Commonsense Constraints for Zero-shot Object Navigation
要約 特定のオブジェクトを正確に見つけてナビゲートする機能は、実世界で動作し、オ … 続きを読む
Shape-aware Text-driven Layered Video Editing
要約 ビデオ編集アプリケーションでは、時間的な一貫性が不可欠です。 ビデオの階層 … 続きを読む
Accurate Gaze Estimation using an Active-gaze Morphable Model
要約 画像から直接視線方向を回帰するのではなく、3D 形状モデルを追加すると、i … 続きを読む
カテゴリー: cs.CV
Accurate Gaze Estimation using an Active-gaze Morphable Model はコメントを受け付けていません
Extracting Training Data from Diffusion Models
要約 DALL-E 2、Imagen、Stable Diffusion などの画 … 続きを読む
Audio-Visual Segmentation with Semantics
要約 オーディオ ビジュアル セグメンテーション (AVS) と呼ばれる新しい問 … 続きを読む
カテゴリー: cs.CV
Audio-Visual Segmentation with Semantics はコメントを受け付けていません
Adaptive Computation with Elastic Input Sequence
要約 問題を解決するとき、人間は、使用する情報の種類、手順、および問題にアプロー … 続きを読む
Unlocking Slot Attention by Changing Optimal Transport Costs
要約 スロット アテンションは、画像やビデオでオブジェクト中心のモデリングを行う … 続きを読む
Image Restoration with Mean-Reverting Stochastic Differential Equations
要約 この論文では、汎用画像復元のための確率微分方程式 (SDE) アプローチを … 続きを読む
PCV: A Point Cloud-Based Network Verifier
要約 リアルタイムの LiDAR ベースの点群データを使用した 3D ビジョンは … 続きを読む