「cs.CV」カテゴリーアーカイブ

Is Generative Communication between Embodied Agents Good for Zero-Shot ObjectNav?

投稿日: 2024年8月13日作成者: jarxiv

要約 Zero-Shot ObjectNav では、具体化された地上エージェント … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

CoFiI2P: Coarse-to-Fine Correspondences for Image-to-Point Cloud Registration

投稿日: 2024年8月13日作成者: jarxiv

要約画像からポイントクラウド (I2P) への登録は、ロボットや自動運転車が … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Spb3DTracker: A Robust LiDAR-Based Person Tracker for Noisy Environmen

投稿日: 2024年8月13日作成者: jarxiv

要約人物検出および追跡 (PDT) は、自動運転車分野における 2D カメラベ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

TDANet: Target-Directed Attention Network For Object-Goal Visual Navigation With Zero-Shot Ability

投稿日: 2024年8月13日作成者: jarxiv

要約新しいテスト環境ではオブジェクトのクラスと配置が異なるため、オブジェクトと … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Integrating Present and Past in Unsupervised Continual Learning

投稿日: 2024年8月13日作成者: jarxiv

要約私たちは教師なし継続学習 (UCL) のための統一フレームワークを策定しま … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

ARPA: A Novel Hybrid Model for Advancing Visual Word Disambiguation Using Large Language Models and Transformers

投稿日: 2024年8月13日作成者: jarxiv

要約急速に進化する自然言語処理とコンピュータービジョンの分野では、視覚的単語 … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

IN-Sight: Interactive Navigation through Sight

投稿日: 2024年8月13日作成者: jarxiv

要約現在のビジュアルナビゲーションシステムは、環境を静的なものとして扱うこ … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO, I.2.10 | コメントを受け付けていません

Helios: An extremely low power event-based gesture recognition for always-on smart eyewear

投稿日: 2024年8月13日作成者: jarxiv

要約この文書では、スマートアイウェアを一日中装着できるように設計された初の超 … 続きを読む →

カテゴリー: cs.CV, cs.HC, cs.LG | コメントを受け付けていません

BooW-VTON: Boosting In-the-Wild Virtual Try-On via Mask-Free Pseudo Data Training

投稿日: 2024年8月13日作成者: jarxiv

要約画像ベースの仮想試着は、特定の人物のリアルな試着画像を生成するための重要な … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Learning Invariant Causal Mechanism from Vision-Language Models

投稿日: 2024年8月13日作成者: jarxiv

要約 CLIP などの大規模な事前トレーニング済み視覚言語モデルは、さまざまな下 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Is Generative Communication between Embodied Agents Good for Zero-Shot ObjectNav?

CoFiI2P: Coarse-to-Fine Correspondences for Image-to-Point Cloud Registration

Spb3DTracker: A Robust LiDAR-Based Person Tracker for Noisy Environmen

TDANet: Target-Directed Attention Network For Object-Goal Visual Navigation With Zero-Shot Ability

Integrating Present and Past in Unsupervised Continual Learning

ARPA: A Novel Hybrid Model for Advancing Visual Word Disambiguation Using Large Language Models and Transformers

IN-Sight: Interactive Navigation through Sight

Helios: An extremely low power event-based gesture recognition for always-on smart eyewear

BooW-VTON: Boosting In-the-Wild Virtual Try-On via Mask-Free Pseudo Data Training

Learning Invariant Causal Mechanism from Vision-Language Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー