cs.CV」カテゴリーアーカイブ

Representation Alignment for Generation: Training Diffusion Transformers Is Easier Than You Think

要約 最近の研究では、(生成) 拡散モデルのノイズ除去プロセスにより、モデル内に … 続きを読む

カテゴリー: cs.CV, cs.LG | Representation Alignment for Generation: Training Diffusion Transformers Is Easier Than You Think はコメントを受け付けていません

ELMO: Enhanced Real-time LiDAR Motion Capture through Upsampling

要約 このペーパーでは、単一の LiDAR センサー用に設計されたリアルタイム … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | ELMO: Enhanced Real-time LiDAR Motion Capture through Upsampling はコメントを受け付けていません

Bridge the Points: Graph-based Few-shot Segment Anything Semantically

要約 大規模な事前トレーニング技術の最近の進歩により、ビジョン基盤モデル、特にポ … 続きを読む

カテゴリー: cs.CV | Bridge the Points: Graph-based Few-shot Segment Anything Semantically はコメントを受け付けていません

SparseVLM: Visual Token Sparsification for Efficient Vision-Language Model Inference

要約 ビジョン言語モデル (VLM) では、ビジュアル トークンは、テキスト ト … 続きを読む

カテゴリー: cs.CV | SparseVLM: Visual Token Sparsification for Efficient Vision-Language Model Inference はコメントを受け付けていません

The BRAVO Semantic Segmentation Challenge Results in UNCV2024

要約 私たちは、現実的な摂動や未知の配信外 (OOD) シナリオの下でセマンティ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | The BRAVO Semantic Segmentation Challenge Results in UNCV2024 はコメントを受け付けていません

Diagnosis of Malignant Lymphoma Cancer Using Hybrid Optimized Techniques Based on Dense Neural Networks

要約 リンパ腫の診断、特にサブタイプを区別することは効果的な治療に不可欠ですが、 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Diagnosis of Malignant Lymphoma Cancer Using Hybrid Optimized Techniques Based on Dense Neural Networks はコメントを受け付けていません

Adaptive High-Frequency Transformer for Diverse Wildlife Re-Identification

要約 Wildlife ReID には、視覚テクノロジーを利用してさまざまなシナ … 続きを読む

カテゴリー: cs.AI, cs.CV | Adaptive High-Frequency Transformer for Diverse Wildlife Re-Identification はコメントを受け付けていません

Structure-Centric Robust Monocular Depth Estimation via Knowledge Distillation

要約 自己教師あり学習によって可能になる単眼の奥行き推定は、コンピューター ビジ … 続きを読む

カテゴリー: cs.CV | Structure-Centric Robust Monocular Depth Estimation via Knowledge Distillation はコメントを受け付けていません

Jointly Generating Multi-view Consistent PBR Textures using Collaborative Control

要約 マルチビューの一貫性は、画像拡散モデルにとって依然として課題です。 完全な … 続きを読む

カテゴリー: cs.CV, cs.GR | Jointly Generating Multi-view Consistent PBR Textures using Collaborative Control はコメントを受け付けていません

A Unified Generative Framework for Realistic Lidar Simulation in Autonomous Driving Systems

要約 知覚センサーのシミュレーション モデルは、自動運転システム (ADS) の … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO, eess.IV | A Unified Generative Framework for Realistic Lidar Simulation in Autonomous Driving Systems はコメントを受け付けていません