月別アーカイブ: 2025年2月

Foundation Models in Computational Pathology: A Review of Challenges, Opportunities, and Impact

要約 自己監視のビジョン専用モデルから対照的な視覚言語フレームワークまで、計算病 … 続きを読む

カテゴリー: cs.CV | Foundation Models in Computational Pathology: A Review of Challenges, Opportunities, and Impact はコメントを受け付けていません

Hi-End-MAE: Hierarchical encoder-driven masked autoencoders are stronger vision learners for medical image segmentation

要約 医療画像のセグメンテーションは、ラベルの希少性のために恐ろしい課題のままで … 続きを読む

カテゴリー: cs.CV | Hi-End-MAE: Hierarchical encoder-driven masked autoencoders are stronger vision learners for medical image segmentation はコメントを受け付けていません

Sat-DN: Implicit Surface Reconstruction from Multi-View Satellite Images with Depth and Normal Supervision

要約 衛星イメージングテクノロジーの進歩により、高解像度のマルチビュー衛星画像を … 続きを読む

カテゴリー: cs.CV | Sat-DN: Implicit Surface Reconstruction from Multi-View Satellite Images with Depth and Normal Supervision はコメントを受け付けていません

Uncertainty Aware Human-machine Collaboration in Camouflaged Object Detection

要約 環境内で隠されたオブジェクトを識別するタスクであるカモフラージュオブジェク … 続きを読む

カテゴリー: cs.AI, cs.CV | Uncertainty Aware Human-machine Collaboration in Camouflaged Object Detection はコメントを受け付けていません

AdvSwap: Covert Adversarial Perturbation with High Frequency Info-swapping for Autonomous Driving Perception

要約 自律車両(AVS)の知覚モジュールは、攻撃の影響を受けやすくなり、敵対的な … 続きを読む

カテゴリー: cs.CV | AdvSwap: Covert Adversarial Perturbation with High Frequency Info-swapping for Autonomous Driving Perception はコメントを受け付けていません

Not All Frame Features Are Equal: Video-to-4D Generation via Decoupling Dynamic-Static Features

要約 最近、ビデオからの動的な3Dオブジェクトの生成が印象的な結果を示しています … 続きを読む

カテゴリー: cs.CV | Not All Frame Features Are Equal: Video-to-4D Generation via Decoupling Dynamic-Static Features はコメントを受け付けていません

Robust Visual Representation Learning with Multi-modal Prior Knowledge for Image Classification Under Distribution Shift

要約 コンピュータービジョンにおける深いニューラルネットワーク(DNNS)の顕著 … 続きを読む

カテゴリー: cs.CV, cs.LG | Robust Visual Representation Learning with Multi-modal Prior Knowledge for Image Classification Under Distribution Shift はコメントを受け付けていません

Gramian Multimodal Representation Learning and Alignment

要約 人間の知覚は、ビジョン、聴覚、言語などの複数のモダリティを、周囲の現実の統 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Gramian Multimodal Representation Learning and Alignment はコメントを受け付けていません

A Survey on Video Analytics in Cloud-Edge-Terminal Collaborative Systems

要約 ビデオデータの爆発的な成長により、クラウドエッジターミナルコラボレーティブ … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.NI | A Survey on Video Analytics in Cloud-Edge-Terminal Collaborative Systems はコメントを受け付けていません

ViLa-MIL: Dual-scale Vision-Language Multiple Instance Learning for Whole Slide Image Classification

要約 複数のインスタンス学習(MIL)ベースのフレームワークは、デジタル病理にお … 続きを読む

カテゴリー: cs.CV | ViLa-MIL: Dual-scale Vision-Language Multiple Instance Learning for Whole Slide Image Classification はコメントを受け付けていません