「cs.CV」カテゴリーアーカイブ

Exploiting Local Features and Range Images for Small Data Real-Time Point Cloud Semantic Segmentation

投稿日: 2024年10月15日作成者: jarxiv

要約点群のセマンティックセグメンテーションは、自動運転やロボット工学における … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

ROSAR: An Adversarial Re-Training Framework for Robust Side-Scan Sonar Object Detection

投稿日: 2024年10月15日作成者: jarxiv

要約この論文では、ソナーセンサーを使用して自律型水中ビークルによって生成され … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Uplifting Lower-Income Data: Strategies for Socioeconomic Perspective Shifts in Large Multi-modal Models

投稿日: 2024年10月15日作成者: jarxiv

要約最近の研究では、トレーニングデータにおける文化と社会経済的グループの不平 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.CY, I.2.7 | コメントを受け付けていません

TopoFR: A Closer Look at Topology Alignment on Face Recognition

投稿日: 2024年10月15日作成者: jarxiv

要約顔認識 (FR) の分野は、ディープラーニングの台頭により大幅な進歩を遂げ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

MoTE: Reconciling Generalization with Specialization for Visual-Language to Video Knowledge Transfer

投稿日: 2024年10月15日作成者: jarxiv

要約ビデオ認識の大規模基礎モデルから視覚言語の知識を転送することが効果的である … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

VisRAG: Vision-based Retrieval-augmented Generation on Multi-modality Documents

投稿日: 2024年10月15日作成者: jarxiv

要約検索拡張生成 (RAG) は、大規模言語モデル (LLM) が外部の知識ソ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.IR | コメントを受け付けていません

BrainMVP: Multi-modal Vision Pre-training for Brain Image Analysis using Multi-parametric MRI

投稿日: 2024年10月15日作成者: jarxiv

要約脳異常の正確な診断は、相補的なマルチパラメトリック MRI 画像データを含 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

AR-TTA: A Simple Method for Real-World Continual Test-Time Adaptation

投稿日: 2024年10月15日作成者: jarxiv

要約テスト時の適応は、ソースモデルが監視なしでデータ分布の変化に適応できるよ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

SANA: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformers

投稿日: 2024年10月15日作成者: jarxiv

要約最大 4096$\times$4096 の解像度の画像を効率的に生成できる … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

GAIA: Rethinking Action Quality Assessment for AI-Generated Videos

投稿日: 2024年10月15日作成者: jarxiv

要約アクションの品質の評価は、AI 生成ビデオの品質に重大な影響を与えるため、 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Exploiting Local Features and Range Images for Small Data Real-Time Point Cloud Semantic Segmentation

ROSAR: An Adversarial Re-Training Framework for Robust Side-Scan Sonar Object Detection

Uplifting Lower-Income Data: Strategies for Socioeconomic Perspective Shifts in Large Multi-modal Models

TopoFR: A Closer Look at Topology Alignment on Face Recognition

MoTE: Reconciling Generalization with Specialization for Visual-Language to Video Knowledge Transfer

VisRAG: Vision-based Retrieval-augmented Generation on Multi-modality Documents

BrainMVP: Multi-modal Vision Pre-training for Brain Image Analysis using Multi-parametric MRI

AR-TTA: A Simple Method for Real-World Continual Test-Time Adaptation

SANA: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformers

GAIA: Rethinking Action Quality Assessment for AI-Generated Videos

最近の投稿

最近のコメント

アーカイブ

カテゴリー