cs.CV」カテゴリーアーカイブ

Multi-view Structural Convolution Network for Domain-Invariant Point Cloud Recognition of Autonomous Vehicles

要約 ポイントクラウドの表現は最近、コンピュータービジョンの分野での研究ホットス … 続きを読む

カテゴリー: cs.CV | Multi-view Structural Convolution Network for Domain-Invariant Point Cloud Recognition of Autonomous Vehicles はコメントを受け付けていません

ObjectVLA: End-to-End Open-World Object Manipulation Without Demonstration

要約 模倣学習は、ロボットの器用な操作スキルを教えるのに非常に効果的であることが … 続きを読む

カテゴリー: cs.CV, cs.RO | ObjectVLA: End-to-End Open-World Object Manipulation Without Demonstration はコメントを受け付けていません

A Pragmatic Note on Evaluating Generative Models with Fréchet Inception Distance for Retinal Image Synthesis

要約 イメージネットの前提条件-V3ネットワークで計算されたfre \ &#82 … 続きを読む

カテゴリー: cs.CV, cs.LG | A Pragmatic Note on Evaluating Generative Models with Fréchet Inception Distance for Retinal Image Synthesis はコメントを受け付けていません

Deep learning and classical computer vision techniques in medical image analysis: Case studies on brain MRI tissue segmentation, lung CT COPD registration, and skin lesion classification

要約 医療イメージングは​​、疾患の診断、治療計画、および監視において極めて重要 … 続きを読む

カテゴリー: cs.CV, eess.IV | Deep learning and classical computer vision techniques in medical image analysis: Case studies on brain MRI tissue segmentation, lung CT COPD registration, and skin lesion classification はコメントを受け付けていません

Movie Gen: A Cast of Media Foundation Models

要約 さまざまなアスペクト比と同期オーディオを備えた高品質の1080p HDビデ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV | Movie Gen: A Cast of Media Foundation Models はコメントを受け付けていません

EMT: A Visual Multi-Task Benchmark Dataset for Autonomous Driving in the Arab Gulf Region

要約 このペーパーでは、アラブ湾岸地域で収集された自律運転のための最初の公開デー … 続きを読む

カテゴリー: cs.AI, cs.CV | EMT: A Visual Multi-Task Benchmark Dataset for Autonomous Driving in the Arab Gulf Region はコメントを受け付けていません

Neural Antidote: Class-Wise Prompt Tuning for Purifying Backdoors in Pre-trained Vision-Language Models

要約 クリップなどの事前に訓練されたビジョン言語モデル(VLM)は、マルチモーダ … 続きを読む

カテゴリー: cs.CV | Neural Antidote: Class-Wise Prompt Tuning for Purifying Backdoors in Pre-trained Vision-Language Models はコメントを受け付けていません

On the Importance of Text Preprocessing for Multimodal Representation Learning and Pathology Report Generation

要約 病理学のビジョン言語モデルにより、マルチモーダルケースの検索と自動レポート … 続きを読む

カテゴリー: cs.CV | On the Importance of Text Preprocessing for Multimodal Representation Learning and Pathology Report Generation はコメントを受け付けていません

Multiclass Post-Earthquake Building Assessment Integrating Optical and SAR Satellite Imagery, Ground Motion, and Soil Data with Transformers

要約 建物の損傷のタイムリーで正確な評価は、地震の余波における効果的な対応と回復 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Multiclass Post-Earthquake Building Assessment Integrating Optical and SAR Satellite Imagery, Ground Motion, and Soil Data with Transformers はコメントを受け付けていません

Pathology Report Generation and Multimodal Representation Learning for Cutaneous Melanocytic Lesions

要約 数百万のメラニン細胞皮膚病変が毎年病理学者によって検査されていますが、その … 続きを読む

カテゴリー: cs.CV | Pathology Report Generation and Multimodal Representation Learning for Cutaneous Melanocytic Lesions はコメントを受け付けていません