月別アーカイブ: 2023年5月

POEM: Polarization of Embeddings for Domain-Invariant Representations

要約 配布外のサンプルの処理は、ディープ ビジュアル モデルにとって長期にわたる … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | POEM: Polarization of Embeddings for Domain-Invariant Representations はコメントを受け付けていません

AudioToken: Adaptation of Text-Conditioned Diffusion Models for Audio-to-Image Generation

要約 近年、画像生成のパフォーマンスは大幅に向上しており、拡散モデルが中心的な役 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.SD, eess.AS | AudioToken: Adaptation of Text-Conditioned Diffusion Models for Audio-to-Image Generation はコメントを受け付けていません

Learning Pedestrian Actions to Ensure Safe Autonomous Driving

要約 車両と歩行者の相互作用が複雑な都市環境で安全な自動運転を確保するには、自動 … 続きを読む

カテゴリー: cs.CV, cs.RO | Learning Pedestrian Actions to Ensure Safe Autonomous Driving はコメントを受け付けていません

Parallelizing Optical Flow Estimation on an Ultra-Low Power RISC-V Cluster for Nano-UAV Navigation

要約 オプティカル フロー推定は、無人航空機 (UAV) の自律ナビゲーションと … 続きを読む

カテゴリー: cs.CV, cs.RO, eess.IV | Parallelizing Optical Flow Estimation on an Ultra-Low Power RISC-V Cluster for Nano-UAV Navigation はコメントを受け付けていません

Navya3DSeg — Navya 3D Semantic Segmentation Dataset & split generation for autonomous vehicles

要約 現在、自動運転 (AD) の認識は、大規模なアノテーション付きデータセット … 続きを読む

カテゴリー: cs.CV, cs.LG | Navya3DSeg — Navya 3D Semantic Segmentation Dataset & split generation for autonomous vehicles はコメントを受け付けていません

ControlVideo: Training-free Controllable Text-to-Video Generation

要約 テキスト駆動の拡散モデルは、画像生成において前例のない能力を解放しましたが … 続きを読む

カテゴリー: cs.CV | ControlVideo: Training-free Controllable Text-to-Video Generation はコメントを受け付けていません

Restore Anything Pipeline: Segment Anything Meets Image Restoration

要約 最近の画像復元手法は、深層学習を使用して大幅な進歩を遂げています。 しかし … 続きを読む

カテゴリー: 94A08, cs.AI, cs.CV, cs.LG, eess.IV, I.2 | Restore Anything Pipeline: Segment Anything Meets Image Restoration はコメントを受け付けていません

Open-world Semi-supervised Novel Class Discovery

要約 従来の半教師あり学習タスクは、ラベル付きデータとラベルなしデータの両方が同 … 続きを読む

カテゴリー: cs.CV, cs.LG | Open-world Semi-supervised Novel Class Discovery はコメントを受け付けていません

GSURE-Based Diffusion Model Training with Corrupted Data

要約 拡散モデルは、データ生成と、逆問題、テキストベースの編集、分類などの下流タ … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | GSURE-Based Diffusion Model Training with Corrupted Data はコメントを受け付けていません

VLAB: Enhancing Video Language Pre-training by Feature Adapting and Blending

要約 CLIP などの大規模な画像とテキストの対照的な事前トレーニング モデルは … 続きを読む

カテゴリー: cs.CV | VLAB: Enhancing Video Language Pre-training by Feature Adapting and Blending はコメントを受け付けていません