-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年2月
Foundation Models in Computational Pathology: A Review of Challenges, Opportunities, and Impact
要約 自己監視のビジョン専用モデルから対照的な視覚言語フレームワークまで、計算病 … 続きを読む
カテゴリー: cs.CV
Foundation Models in Computational Pathology: A Review of Challenges, Opportunities, and Impact はコメントを受け付けていません
Hi-End-MAE: Hierarchical encoder-driven masked autoencoders are stronger vision learners for medical image segmentation
要約 医療画像のセグメンテーションは、ラベルの希少性のために恐ろしい課題のままで … 続きを読む
カテゴリー: cs.CV
Hi-End-MAE: Hierarchical encoder-driven masked autoencoders are stronger vision learners for medical image segmentation はコメントを受け付けていません
Sat-DN: Implicit Surface Reconstruction from Multi-View Satellite Images with Depth and Normal Supervision
要約 衛星イメージングテクノロジーの進歩により、高解像度のマルチビュー衛星画像を … 続きを読む
カテゴリー: cs.CV
Sat-DN: Implicit Surface Reconstruction from Multi-View Satellite Images with Depth and Normal Supervision はコメントを受け付けていません
Uncertainty Aware Human-machine Collaboration in Camouflaged Object Detection
要約 環境内で隠されたオブジェクトを識別するタスクであるカモフラージュオブジェク … 続きを読む
AdvSwap: Covert Adversarial Perturbation with High Frequency Info-swapping for Autonomous Driving Perception
要約 自律車両(AVS)の知覚モジュールは、攻撃の影響を受けやすくなり、敵対的な … 続きを読む
カテゴリー: cs.CV
AdvSwap: Covert Adversarial Perturbation with High Frequency Info-swapping for Autonomous Driving Perception はコメントを受け付けていません
Not All Frame Features Are Equal: Video-to-4D Generation via Decoupling Dynamic-Static Features
要約 最近、ビデオからの動的な3Dオブジェクトの生成が印象的な結果を示しています … 続きを読む
カテゴリー: cs.CV
Not All Frame Features Are Equal: Video-to-4D Generation via Decoupling Dynamic-Static Features はコメントを受け付けていません
Robust Visual Representation Learning with Multi-modal Prior Knowledge for Image Classification Under Distribution Shift
要約 コンピュータービジョンにおける深いニューラルネットワーク(DNNS)の顕著 … 続きを読む
Gramian Multimodal Representation Learning and Alignment
要約 人間の知覚は、ビジョン、聴覚、言語などの複数のモダリティを、周囲の現実の統 … 続きを読む
A Survey on Video Analytics in Cloud-Edge-Terminal Collaborative Systems
要約 ビデオデータの爆発的な成長により、クラウドエッジターミナルコラボレーティブ … 続きを読む
ViLa-MIL: Dual-scale Vision-Language Multiple Instance Learning for Whole Slide Image Classification
要約 複数のインスタンス学習(MIL)ベースのフレームワークは、デジタル病理にお … 続きを読む
カテゴリー: cs.CV
ViLa-MIL: Dual-scale Vision-Language Multiple Instance Learning for Whole Slide Image Classification はコメントを受け付けていません