cs.CV」カテゴリーアーカイブ

Cross-Modal Mapping: Mitigating the Modality Gap for Few-Shot Image Classification

要約 少ないショット画像分類は、コンピュータービジョンの分野、特にデータスカース … 続きを読む

カテゴリー: cs.CV | Cross-Modal Mapping: Mitigating the Modality Gap for Few-Shot Image Classification はコメントを受け付けていません

Exploring Self-supervised Skeleton-based Action Recognition in Occluded Environments

要約 アクション認識を自律的なロボットシステムに統合するには、人の閉塞などの課題 … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.RO, eess.IV | Exploring Self-supervised Skeleton-based Action Recognition in Occluded Environments はコメントを受け付けていません

OmniDrive: A Holistic Vision-Language Dataset for Autonomous Driving with Counterfactual Reasoning

要約 ビジョン言語モデル(VLM)の進歩により、強力な推論能力を活用するための自 … 続きを読む

カテゴリー: cs.CV | OmniDrive: A Holistic Vision-Language Dataset for Autonomous Driving with Counterfactual Reasoning はコメントを受け付けていません

Strategic Client Selection to Address Non-IIDness in HAPS-enabled FL Networks

要約 高高度プラットフォームステーション(HAPS)によってサポートされている非 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.NI | Strategic Client Selection to Address Non-IIDness in HAPS-enabled FL Networks はコメントを受け付けていません

Deep Anatomical Federated Network (Dafne): An open client-server framework for the continuous, collaborative improvement of deep learning-based medical image segmentation

要約 目的:Dafne(深い解剖学的フェデレーションネットワーク)を提示して評価 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Deep Anatomical Federated Network (Dafne): An open client-server framework for the continuous, collaborative improvement of deep learning-based medical image segmentation はコメントを受け付けていません

CodingHomo: Bootstrapping Deep Homography With Video Coding

要約 ホモグラフィーの推定は、多様な分野でのアプリケーションを備えたコンピュータ … 続きを読む

カテゴリー: cs.CV | CodingHomo: Bootstrapping Deep Homography With Video Coding はコメントを受け付けていません

RADLER: Radar Object Detection Leveraging Semantic 3D City Models and Self-Supervised Radar-Image Learning

要約 セマンティック3Dシティモデルは、世界的に簡単にアクセス可能で、正確でオブ … 続きを読む

カテゴリー: cs.CV, cs.LG | RADLER: Radar Object Detection Leveraging Semantic 3D City Models and Self-Supervised Radar-Image Learning はコメントを受け付けていません

Towards a General-Purpose Zero-Shot Synthetic Low-Light Image and Video Pipeline

要約 低光の条件は、人間と機械の両方の注釈に大きな課題をもたらします。 これによ … 続きを読む

カテゴリー: cs.CV, eess.IV | Towards a General-Purpose Zero-Shot Synthetic Low-Light Image and Video Pipeline はコメントを受け付けていません

InfoNCE: Identifying the Gap Between Theory and Practice

要約 Infonceの損失を介した対照学習に関する以前の理論は、特定の仮定の下で … 続きを読む

カテゴリー: cs.CV, cs.LG, stat.ML | InfoNCE: Identifying the Gap Between Theory and Practice はコメントを受け付けていません

SpiritSight Agent: Advanced GUI Agent with One Look

要約 グラフィカルユーザーインターフェイス(GUI)エージェントは、ヒューマンコ … 続きを読む

カテゴリー: cs.CV, cs.HC, cs.RO | SpiritSight Agent: Advanced GUI Agent with One Look はコメントを受け付けていません