月別アーカイブ: 2023年3月

Depth- and Semantics-aware Multi-modal Domain Translation: Generating 3D Panoramic Color Images from LiDAR Point Clouds

投稿日: 2023年3月28日作成者: jarxiv

要約この作業は、LiDAR とカメラセンサー間のマルチモーダルセットアップ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Gazeformer: Scalable, Effective and Fast Prediction of Goal-Directed Human Attention

投稿日: 2023年3月28日作成者: jarxiv

要約ヒューマンコンピュータインタラクション (HCI) では、人間の視線を … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Unsupervised Adaptation from Repeated Traversals for Autonomous Driving

投稿日: 2023年3月28日作成者: jarxiv

要約自動運転車が確実に動作するためには、その知覚システムをエンドユーザーの環境 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Diffusion Models for Memory-efficient Processing of 3D Medical Images

投稿日: 2023年3月28日作成者: jarxiv

要約ノイズ除去拡散モデルは、最近、多くの画像生成タスクで最先端のパフォーマンス … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Audio Visual Language Maps for Robot Navigation

投稿日: 2023年3月28日作成者: jarxiv

要約世界での相互作用は多感覚の経験ですが、多くのロボットは、主に視覚に依存して … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Progressive Semantic-Visual Mutual Adaption for Generalized Zero-Shot Learning

投稿日: 2023年3月28日作成者: jarxiv

要約 Generalized Zero-Shot Learning (GZSL) … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

3D Human Pose and Shape Estimation via HybrIK-Transformer

投稿日: 2023年3月28日作成者: jarxiv

要約 HybrIK は、解析的な逆運動学とディープラーニングの組み合わせに依存 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

DreamBooth3D: Subject-Driven Text-to-3D Generation

投稿日: 2023年3月28日作成者: jarxiv

要約 DreamBooth3D は、3 ～ 6 枚のさりげなく撮影された被写体の … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR | コメントを受け付けていません

ByteTrackV2: 2D and 3D Multi-Object Tracking by Associating Every Detection Box

投稿日: 2023年3月28日作成者: jarxiv

要約マルチオブジェクトトラッキング (MOT) は、ビデオフレーム全体のオ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Multi-Modal Few-Shot Object Detection with Meta-Learning-Based Cross-Modal Prompting

投稿日: 2023年3月28日作成者: jarxiv

要約この論文では、マルチモーダルな少数ショットオブジェクト検出 (FSOD) … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

月別アーカイブ: 2023年3月

Depth- and Semantics-aware Multi-modal Domain Translation: Generating 3D Panoramic Color Images from LiDAR Point Clouds

Gazeformer: Scalable, Effective and Fast Prediction of Goal-Directed Human Attention

Unsupervised Adaptation from Repeated Traversals for Autonomous Driving

Diffusion Models for Memory-efficient Processing of 3D Medical Images

Audio Visual Language Maps for Robot Navigation

Progressive Semantic-Visual Mutual Adaption for Generalized Zero-Shot Learning

3D Human Pose and Shape Estimation via HybrIK-Transformer

DreamBooth3D: Subject-Driven Text-to-3D Generation

ByteTrackV2: 2D and 3D Multi-Object Tracking by Associating Every Detection Box

Multi-Modal Few-Shot Object Detection with Meta-Learning-Based Cross-Modal Prompting

最近の投稿

最近のコメント

アーカイブ

カテゴリー