月別アーカイブ: 2023年2月

Joint-MAE: 2D-3D Joint Masked Autoencoders for 3D Point Cloud Pre-training

要約 マスク オートエンコーダー (MAE) は、2D と 3D の両方のコンピ … 続きを読む

カテゴリー: cs.CV | Joint-MAE: 2D-3D Joint Masked Autoencoders for 3D Point Cloud Pre-training はコメントを受け付けていません

DualAfford: Learning Collaborative Visual Affordance for Dual-gripper Object Manipulation

要約 将来のホーム アシスタント ロボットにとって、人間の日常環境で多様な 3D … 続きを読む

カテゴリー: cs.CV, cs.RO | DualAfford: Learning Collaborative Visual Affordance for Dual-gripper Object Manipulation はコメントを受け付けていません

Depth Perspective-aware Multiple Object Tracking

要約 このホワイト ペーパーでは、複数オブジェクト トラッキング (MOT) に … 続きを読む

カテゴリー: cs.CV | Depth Perspective-aware Multiple Object Tracking はコメントを受け付けていません

Subspace Diffusion Generative Models

要約 スコアベースのモデルは、高次元拡散プロセスを介してノイズをデータに (およ … 続きを読む

カテゴリー: cs.CV, cs.LG | Subspace Diffusion Generative Models はコメントを受け付けていません

Image-based Pose Estimation and Shape Reconstruction for Robot Manipulators and Soft, Continuum Robots via Differentiable Rendering

要約 自律システムはセンサーに依存してモーションをキャプチャし、3D 世界でロー … 続きを読む

カテゴリー: cs.CV, cs.RO | Image-based Pose Estimation and Shape Reconstruction for Robot Manipulators and Soft, Continuum Robots via Differentiable Rendering はコメントを受け付けていません

Knowledge-enhanced Pre-training for Auto-diagnosis of Chest Radiology Images

要約 自然言語理解と視覚認識における大規模データで事前トレーニングされたマルチモ … 続きを読む

カテゴリー: cs.CV | Knowledge-enhanced Pre-training for Auto-diagnosis of Chest Radiology Images はコメントを受け付けていません

Language Is Not All You Need: Aligning Perception with Language Models

要約 言語、マルチモーダルな知覚、アクション、および世界モデリングの大きな収束は … 続きを読む

カテゴリー: cs.CL, cs.CV | Language Is Not All You Need: Aligning Perception with Language Models はコメントを受け付けていません

Internet Explorer: Targeted Representation Learning on the Open Web

要約 最新のビジョン モデルは通常、大規模な静的データセットで事前にトレーニング … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.NE, cs.RO | Internet Explorer: Targeted Representation Learning on the Open Web はコメントを受け付けていません

LODE: Locally Conditioned Eikonal Implicit Scene Completion from Sparse LiDAR

要約 シーンの完成とは、複雑な 3D シーンの不完全な認識から高密度のシーン表現 … 続きを読む

カテゴリー: cs.CV | LODE: Locally Conditioned Eikonal Implicit Scene Completion from Sparse LiDAR はコメントを受け付けていません

SLAM Backends with Objects in Motion: A Unifying Framework and Tutorial

要約 Simultaneous Localization and Mapping … 続きを読む

カテゴリー: cs.RO, cs.SY, eess.SY | SLAM Backends with Objects in Motion: A Unifying Framework and Tutorial はコメントを受け付けていません