cs.CV」カテゴリーアーカイブ

Exploiting Local Features and Range Images for Small Data Real-Time Point Cloud Semantic Segmentation

要約 点群のセマンティック セグメンテーションは、自動運転やロボット工学における … 続きを読む

カテゴリー: cs.CV, cs.RO | Exploiting Local Features and Range Images for Small Data Real-Time Point Cloud Semantic Segmentation はコメントを受け付けていません

ROSAR: An Adversarial Re-Training Framework for Robust Side-Scan Sonar Object Detection

要約 この論文では、ソナー センサーを使用して自律型水中ビークルによって生成され … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | ROSAR: An Adversarial Re-Training Framework for Robust Side-Scan Sonar Object Detection はコメントを受け付けていません

Uplifting Lower-Income Data: Strategies for Socioeconomic Perspective Shifts in Large Multi-modal Models

要約 最近の研究では、トレーニング データにおける文化と社会経済的グループの不平 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.CY, I.2.7 | Uplifting Lower-Income Data: Strategies for Socioeconomic Perspective Shifts in Large Multi-modal Models はコメントを受け付けていません

TopoFR: A Closer Look at Topology Alignment on Face Recognition

要約 顔認識 (FR) の分野は、ディープラーニングの台頭により大幅な進歩を遂げ … 続きを読む

カテゴリー: cs.CV, cs.LG | TopoFR: A Closer Look at Topology Alignment on Face Recognition はコメントを受け付けていません

MoTE: Reconciling Generalization with Specialization for Visual-Language to Video Knowledge Transfer

要約 ビデオ認識の大規模基礎モデルから視覚言語の知識を転送することが効果的である … 続きを読む

カテゴリー: cs.CV | MoTE: Reconciling Generalization with Specialization for Visual-Language to Video Knowledge Transfer はコメントを受け付けていません

VisRAG: Vision-based Retrieval-augmented Generation on Multi-modality Documents

要約 検索拡張生成 (RAG) は、大規模言語モデル (LLM) が外部の知識ソ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.IR | VisRAG: Vision-based Retrieval-augmented Generation on Multi-modality Documents はコメントを受け付けていません

BrainMVP: Multi-modal Vision Pre-training for Brain Image Analysis using Multi-parametric MRI

要約 脳異常の正確な診断は、相補的なマルチパラメトリック MRI 画像データを含 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | BrainMVP: Multi-modal Vision Pre-training for Brain Image Analysis using Multi-parametric MRI はコメントを受け付けていません

AR-TTA: A Simple Method for Real-World Continual Test-Time Adaptation

要約 テスト時の適応は、ソース モデルが監視なしでデータ分布の変化に適応できるよ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | AR-TTA: A Simple Method for Real-World Continual Test-Time Adaptation はコメントを受け付けていません

SANA: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformers

要約 最大 4096$\times$4096 の解像度の画像を効率的に生成できる … 続きを読む

カテゴリー: cs.CV | SANA: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformers はコメントを受け付けていません

GAIA: Rethinking Action Quality Assessment for AI-Generated Videos

要約 アクションの品質の評価は、AI 生成ビデオの品質に重大な影響を与えるため、 … 続きを読む

カテゴリー: cs.CV | GAIA: Rethinking Action Quality Assessment for AI-Generated Videos はコメントを受け付けていません