「cs.CV」カテゴリーアーカイブ

Cross-Modal Mapping: Mitigating the Modality Gap for Few-Shot Image Classification

投稿日: 2025年4月17日作成者: jarxiv

要約少ないショット画像分類は、コンピュータービジョンの分野、特にデータスカース … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Exploring Self-supervised Skeleton-based Action Recognition in Occluded Environments

投稿日: 2025年4月17日作成者: jarxiv

要約アクション認識を自律的なロボットシステムに統合するには、人の閉塞などの課題 … 続きを読む →

カテゴリー: cs.CV, cs.MM, cs.RO, eess.IV | コメントを受け付けていません

OmniDrive: A Holistic Vision-Language Dataset for Autonomous Driving with Counterfactual Reasoning

投稿日: 2025年4月17日作成者: jarxiv

要約ビジョン言語モデル（VLM）の進歩により、強力な推論能力を活用するための自 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Strategic Client Selection to Address Non-IIDness in HAPS-enabled FL Networks

投稿日: 2025年4月17日作成者: jarxiv

要約高高度プラットフォームステーション（HAPS）によってサポートされている非 … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.NI | コメントを受け付けていません

Deep Anatomical Federated Network (Dafne): An open client-server framework for the continuous, collaborative improvement of deep learning-based medical image segmentation

投稿日: 2025年4月17日作成者: jarxiv

要約目的：Dafne（深い解剖学的フェデレーションネットワーク）を提示して評価 … 続きを読む →

カテゴリー: cs.CV, cs.LG, eess.IV | コメントを受け付けていません

CodingHomo: Bootstrapping Deep Homography With Video Coding

投稿日: 2025年4月17日作成者: jarxiv

要約ホモグラフィーの推定は、多様な分野でのアプリケーションを備えたコンピュータ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

RADLER: Radar Object Detection Leveraging Semantic 3D City Models and Self-Supervised Radar-Image Learning

投稿日: 2025年4月17日作成者: jarxiv

要約セマンティック3Dシティモデルは、世界的に簡単にアクセス可能で、正確でオブ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Towards a General-Purpose Zero-Shot Synthetic Low-Light Image and Video Pipeline

投稿日: 2025年4月17日作成者: jarxiv

要約低光の条件は、人間と機械の両方の注釈に大きな課題をもたらします。これによ … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

InfoNCE: Identifying the Gap Between Theory and Practice

投稿日: 2025年4月17日作成者: jarxiv

要約 Infonceの損失を介した対照学習に関する以前の理論は、特定の仮定の下で … 続きを読む →

カテゴリー: cs.CV, cs.LG, stat.ML | コメントを受け付けていません

SpiritSight Agent: Advanced GUI Agent with One Look

投稿日: 2025年4月17日作成者: jarxiv

要約グラフィカルユーザーインターフェイス（GUI）エージェントは、ヒューマンコ … 続きを読む →

カテゴリー: cs.CV, cs.HC, cs.RO | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Cross-Modal Mapping: Mitigating the Modality Gap for Few-Shot Image Classification

Exploring Self-supervised Skeleton-based Action Recognition in Occluded Environments

OmniDrive: A Holistic Vision-Language Dataset for Autonomous Driving with Counterfactual Reasoning

Strategic Client Selection to Address Non-IIDness in HAPS-enabled FL Networks

Deep Anatomical Federated Network (Dafne): An open client-server framework for the continuous, collaborative improvement of deep learning-based medical image segmentation

CodingHomo: Bootstrapping Deep Homography With Video Coding

RADLER: Radar Object Detection Leveraging Semantic 3D City Models and Self-Supervised Radar-Image Learning

Towards a General-Purpose Zero-Shot Synthetic Low-Light Image and Video Pipeline

InfoNCE: Identifying the Gap Between Theory and Practice

SpiritSight Agent: Advanced GUI Agent with One Look

最近の投稿

最近のコメント

アーカイブ

カテゴリー