-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Multi-view Structural Convolution Network for Domain-Invariant Point Cloud Recognition of Autonomous Vehicles
要約 ポイントクラウドの表現は最近、コンピュータービジョンの分野での研究ホットス … 続きを読む
カテゴリー: cs.CV
Multi-view Structural Convolution Network for Domain-Invariant Point Cloud Recognition of Autonomous Vehicles はコメントを受け付けていません
ObjectVLA: End-to-End Open-World Object Manipulation Without Demonstration
要約 模倣学習は、ロボットの器用な操作スキルを教えるのに非常に効果的であることが … 続きを読む
A Pragmatic Note on Evaluating Generative Models with Fréchet Inception Distance for Retinal Image Synthesis
要約 イメージネットの前提条件-V3ネットワークで計算されたfre \ R … 続きを読む
Deep learning and classical computer vision techniques in medical image analysis: Case studies on brain MRI tissue segmentation, lung CT COPD registration, and skin lesion classification
要約 医療イメージングは、疾患の診断、治療計画、および監視において極めて重要 … 続きを読む
Movie Gen: A Cast of Media Foundation Models
要約 さまざまなアスペクト比と同期オーディオを備えた高品質の1080p HDビデ … 続きを読む
EMT: A Visual Multi-Task Benchmark Dataset for Autonomous Driving in the Arab Gulf Region
要約 このペーパーでは、アラブ湾岸地域で収集された自律運転のための最初の公開デー … 続きを読む
Neural Antidote: Class-Wise Prompt Tuning for Purifying Backdoors in Pre-trained Vision-Language Models
要約 クリップなどの事前に訓練されたビジョン言語モデル(VLM)は、マルチモーダ … 続きを読む
カテゴリー: cs.CV
Neural Antidote: Class-Wise Prompt Tuning for Purifying Backdoors in Pre-trained Vision-Language Models はコメントを受け付けていません
On the Importance of Text Preprocessing for Multimodal Representation Learning and Pathology Report Generation
要約 病理学のビジョン言語モデルにより、マルチモーダルケースの検索と自動レポート … 続きを読む
カテゴリー: cs.CV
On the Importance of Text Preprocessing for Multimodal Representation Learning and Pathology Report Generation はコメントを受け付けていません
Multiclass Post-Earthquake Building Assessment Integrating Optical and SAR Satellite Imagery, Ground Motion, and Soil Data with Transformers
要約 建物の損傷のタイムリーで正確な評価は、地震の余波における効果的な対応と回復 … 続きを読む
Pathology Report Generation and Multimodal Representation Learning for Cutaneous Melanocytic Lesions
要約 数百万のメラニン細胞皮膚病変が毎年病理学者によって検査されていますが、その … 続きを読む
カテゴリー: cs.CV
Pathology Report Generation and Multimodal Representation Learning for Cutaneous Melanocytic Lesions はコメントを受け付けていません