-
最近の投稿
- Physical Reservoir Computing in Hook-Shaped Rover Wheel Spokes for Real-Time Terrain Identification
- Chain-of-Modality: Learning Manipulation Programs from Multimodal Human Videos with Vision-Language-Models
- Multi-Sensor Fusion-Based Mobile Manipulator Remote Control for Intelligent Smart Home Assistance
- Integration of a Graph-Based Path Planner and Mixed-Integer MPC for Robot Navigation in Cluttered Environments
- Demonstrating CavePI: Autonomous Exploration of Underwater Caves by Semantic Guidance
-
最近のコメント
表示できるコメントはありません。 cs.AI (36829) cs.CL (27883) cs.CV (42623) cs.HC (2814) cs.LG (41781) cs.RO (21795) cs.SY (3320) eess.IV (4979) eess.SY (3312) stat.ML (5469)
月別アーカイブ: 2023年2月
Joint-MAE: 2D-3D Joint Masked Autoencoders for 3D Point Cloud Pre-training
要約 マスク オートエンコーダー (MAE) は、2D と 3D の両方のコンピ … 続きを読む
カテゴリー: cs.CV
Joint-MAE: 2D-3D Joint Masked Autoencoders for 3D Point Cloud Pre-training はコメントを受け付けていません
DualAfford: Learning Collaborative Visual Affordance for Dual-gripper Object Manipulation
要約 将来のホーム アシスタント ロボットにとって、人間の日常環境で多様な 3D … 続きを読む
Depth Perspective-aware Multiple Object Tracking
要約 このホワイト ペーパーでは、複数オブジェクト トラッキング (MOT) に … 続きを読む
カテゴリー: cs.CV
Depth Perspective-aware Multiple Object Tracking はコメントを受け付けていません
Subspace Diffusion Generative Models
要約 スコアベースのモデルは、高次元拡散プロセスを介してノイズをデータに (およ … 続きを読む
Image-based Pose Estimation and Shape Reconstruction for Robot Manipulators and Soft, Continuum Robots via Differentiable Rendering
要約 自律システムはセンサーに依存してモーションをキャプチャし、3D 世界でロー … 続きを読む
Knowledge-enhanced Pre-training for Auto-diagnosis of Chest Radiology Images
要約 自然言語理解と視覚認識における大規模データで事前トレーニングされたマルチモ … 続きを読む
カテゴリー: cs.CV
Knowledge-enhanced Pre-training for Auto-diagnosis of Chest Radiology Images はコメントを受け付けていません
Language Is Not All You Need: Aligning Perception with Language Models
要約 言語、マルチモーダルな知覚、アクション、および世界モデリングの大きな収束は … 続きを読む
Internet Explorer: Targeted Representation Learning on the Open Web
要約 最新のビジョン モデルは通常、大規模な静的データセットで事前にトレーニング … 続きを読む
LODE: Locally Conditioned Eikonal Implicit Scene Completion from Sparse LiDAR
要約 シーンの完成とは、複雑な 3D シーンの不完全な認識から高密度のシーン表現 … 続きを読む
カテゴリー: cs.CV
LODE: Locally Conditioned Eikonal Implicit Scene Completion from Sparse LiDAR はコメントを受け付けていません
SLAM Backends with Objects in Motion: A Unifying Framework and Tutorial
要約 Simultaneous Localization and Mapping … 続きを読む