月別アーカイブ: 2023年3月

Depth- and Semantics-aware Multi-modal Domain Translation: Generating 3D Panoramic Color Images from LiDAR Point Clouds

要約 この作業は、LiDAR とカメラ センサー間のマルチモーダル セットアップ … 続きを読む

カテゴリー: cs.CV | Depth- and Semantics-aware Multi-modal Domain Translation: Generating 3D Panoramic Color Images from LiDAR Point Clouds はコメントを受け付けていません

Gazeformer: Scalable, Effective and Fast Prediction of Goal-Directed Human Attention

要約 ヒューマン コンピュータ インタラクション (HCI) では、人間の視線を … 続きを読む

カテゴリー: cs.CV | Gazeformer: Scalable, Effective and Fast Prediction of Goal-Directed Human Attention はコメントを受け付けていません

Unsupervised Adaptation from Repeated Traversals for Autonomous Driving

要約 自動運転車が確実に動作するためには、その知覚システムをエンドユーザーの環境 … 続きを読む

カテゴリー: cs.CV, cs.LG | Unsupervised Adaptation from Repeated Traversals for Autonomous Driving はコメントを受け付けていません

Diffusion Models for Memory-efficient Processing of 3D Medical Images

要約 ノイズ除去拡散モデルは、最近、多くの画像生成タスクで最先端のパフォーマンス … 続きを読む

カテゴリー: cs.CV, cs.LG | Diffusion Models for Memory-efficient Processing of 3D Medical Images はコメントを受け付けていません

Audio Visual Language Maps for Robot Navigation

要約 世界での相互作用は多感覚の経験ですが、多くのロボットは、主に視覚に依存して … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | Audio Visual Language Maps for Robot Navigation はコメントを受け付けていません

Progressive Semantic-Visual Mutual Adaption for Generalized Zero-Shot Learning

要約 Generalized Zero-Shot Learning (GZSL) … 続きを読む

カテゴリー: cs.CV | Progressive Semantic-Visual Mutual Adaption for Generalized Zero-Shot Learning はコメントを受け付けていません

3D Human Pose and Shape Estimation via HybrIK-Transformer

要約 HybrIK は、解析的な逆運動学とディープ ラーニングの組み合わせに依存 … 続きを読む

カテゴリー: cs.CV | 3D Human Pose and Shape Estimation via HybrIK-Transformer はコメントを受け付けていません

DreamBooth3D: Subject-Driven Text-to-3D Generation

要約 DreamBooth3D は、3 ~ 6 枚のさりげなく撮影された被写体の … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | DreamBooth3D: Subject-Driven Text-to-3D Generation はコメントを受け付けていません

ByteTrackV2: 2D and 3D Multi-Object Tracking by Associating Every Detection Box

要約 マルチオブジェクト トラッキング (MOT) は、ビデオ フレーム全体のオ … 続きを読む

カテゴリー: cs.CV | ByteTrackV2: 2D and 3D Multi-Object Tracking by Associating Every Detection Box はコメントを受け付けていません

Multi-Modal Few-Shot Object Detection with Meta-Learning-Based Cross-Modal Prompting

要約 この論文では、マルチモーダルな少数ショットオブジェクト検出 (FSOD) … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Multi-Modal Few-Shot Object Detection with Meta-Learning-Based Cross-Modal Prompting はコメントを受け付けていません