cs.CV」カテゴリーアーカイブ

Is Generative Communication between Embodied Agents Good for Zero-Shot ObjectNav?

要約 Zero-Shot ObjectNav では、具体化された地上エージェント … 続きを読む

カテゴリー: cs.CV, cs.RO | Is Generative Communication between Embodied Agents Good for Zero-Shot ObjectNav? はコメントを受け付けていません

CoFiI2P: Coarse-to-Fine Correspondences for Image-to-Point Cloud Registration

要約 画像からポイント クラウド (I2P) への登録は、ロボットや自動運転車が … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | CoFiI2P: Coarse-to-Fine Correspondences for Image-to-Point Cloud Registration はコメントを受け付けていません

Spb3DTracker: A Robust LiDAR-Based Person Tracker for Noisy Environmen

要約 人物検出および追跡 (PDT) は、自動運転車分野における 2D カメラベ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Spb3DTracker: A Robust LiDAR-Based Person Tracker for Noisy Environmen はコメントを受け付けていません

TDANet: Target-Directed Attention Network For Object-Goal Visual Navigation With Zero-Shot Ability

要約 新しいテスト環境ではオブジェクトのクラスと配置が異なるため、オブジェクトと … 続きを読む

カテゴリー: cs.CV, cs.RO | TDANet: Target-Directed Attention Network For Object-Goal Visual Navigation With Zero-Shot Ability はコメントを受け付けていません

Integrating Present and Past in Unsupervised Continual Learning

要約 私たちは教師なし継続学習 (UCL) のための統一フレームワークを策定しま … 続きを読む

カテゴリー: cs.CV, cs.LG | Integrating Present and Past in Unsupervised Continual Learning はコメントを受け付けていません

ARPA: A Novel Hybrid Model for Advancing Visual Word Disambiguation Using Large Language Models and Transformers

要約 急速に進化する自然言語処理とコンピューター ビジョンの分野では、視覚的単語 … 続きを読む

カテゴリー: cs.CL, cs.CV | ARPA: A Novel Hybrid Model for Advancing Visual Word Disambiguation Using Large Language Models and Transformers はコメントを受け付けていません

IN-Sight: Interactive Navigation through Sight

要約 現在のビジュアル ナビゲーション システムは、環境を静的なものとして扱うこ … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO, I.2.10 | IN-Sight: Interactive Navigation through Sight はコメントを受け付けていません

Helios: An extremely low power event-based gesture recognition for always-on smart eyewear

要約 この文書では、スマート アイウェアを一日中装着できるように設計された初の超 … 続きを読む

カテゴリー: cs.CV, cs.HC, cs.LG | Helios: An extremely low power event-based gesture recognition for always-on smart eyewear はコメントを受け付けていません

BooW-VTON: Boosting In-the-Wild Virtual Try-On via Mask-Free Pseudo Data Training

要約 画像ベースの仮想試着は、特定の人物のリアルな試着画像を生成するための重要な … 続きを読む

カテゴリー: cs.CV | BooW-VTON: Boosting In-the-Wild Virtual Try-On via Mask-Free Pseudo Data Training はコメントを受け付けていません

Learning Invariant Causal Mechanism from Vision-Language Models

要約 CLIP などの大規模な事前トレーニング済み視覚言語モデルは、さまざまな下 … 続きを読む

カテゴリー: cs.CV | Learning Invariant Causal Mechanism from Vision-Language Models はコメントを受け付けていません