-
最近の投稿
- Towards Generalizable Vision-Language Robotic Manipulation: A Benchmark and LLM-guided 3D Policy
- Haptic-ACT: Bridging Human Intuition with Compliant Robotic Manipulation via Immersive VR
- Task-Aware Robotic Grasping by evaluating Quality Diversity Solutions through Foundation Models
- VDT-Auto: End-to-end Autonomous Driving with VLM-Guided Diffusion Transformers
- ViViDex: Learning Vision-based Dexterous Manipulation from Human Videos
-
最近のコメント
表示できるコメントはありません。 cs.AI (34550) cs.CL (26107) cs.CR (2648) cs.CV (40394) cs.LG (39550) cs.RO (20191) cs.SY (3066) eess.IV (4803) eess.SY (3060) stat.ML (5206)
月別アーカイブ: 2022年6月
Few-shot Segmentation with Optimal Transport Matching and Message Flow
要約 この作業では、数ショットのセグメンテーションという難しいタスクに取り組みま … 続きを読む
カテゴリー: cs.CV
Few-shot Segmentation with Optimal Transport Matching and Message Flow はコメントを受け付けていません
Multi-Session Visual SLAM for Illumination Invariant Re-Localization in Indoor Environments
要約 カメラのみを使用してナビゲートするロボットの場合、屋内環境での照明の変化に … 続きを読む
LViT: Language meets Vision Transformer in Medical Image Segmentation
要約 ディープラーニングは、医療画像のセグメンテーションやその他の側面で広く使用 … 続きを読む
カテゴリー: cs.CV
LViT: Language meets Vision Transformer in Medical Image Segmentation はコメントを受け付けていません
Automated GI tract segmentation using deep learning
要約 放射線腫瘍医の仕事は、腫瘍に向けられたX線ビームを照射すると同時に、胃や腸 … 続きを読む
GO-Surf: Neural Feature Grid Optimization for Fast, High-Fidelity RGB-D Surface Reconstruction
要約 RGB-Dシーケンスからの正確で高速な表面再構成のための直接特徴グリッド最 … 続きを読む
カテゴリー: cs.CV
GO-Surf: Neural Feature Grid Optimization for Fast, High-Fidelity RGB-D Surface Reconstruction はコメントを受け付けていません
Placenta Segmentation in Ultrasound Imaging: Addressing Sources of Uncertainty and Limited Field-of-View
要約 胎児超音波(US)での胎盤の自動セグメンテーションは、(i)胎盤の外観の多 … 続きを読む
TranSalNet: Towards perceptually relevant visual saliency prediction
要約 トランスフォーマーを使用した視覚的顕著性予測-畳み込みニューラルネットワー … 続きを読む
On Monocular Depth Estimation and Uncertainty Quantification using Classification Approaches for Regression
要約 単眼深度は、3D再構築や自動運転などの多くのタスクで重要です。 ディープラ … 続きを読む
DOVE: Learning Deformable 3D Objects by Watching Videos
要約 2D画像から変形可能な3Dオブジェクトを学習することは、多くの場合、不適切 … 続きを読む
カテゴリー: cs.CV
DOVE: Learning Deformable 3D Objects by Watching Videos はコメントを受け付けていません
3D-Aware Video Generation
要約 生成モデルは、多くの画像合成および編集タスクに不可欠な構成要素として浮上し … 続きを読む