cs.CV」カテゴリーアーカイブ

Flow Distillation Sampling: Regularizing 3D Gaussians with Pre-trained Matching Priors

要約 3D Gaussian Splatting(3DGS)は、高速トレーニング … 続きを読む

カテゴリー: cs.CV | Flow Distillation Sampling: Regularizing 3D Gaussians with Pre-trained Matching Priors はコメントを受け付けていません

Scaling Pre-training to One Hundred Billion Data for Vision Language Models

要約 前例のないスケールでのトレーニング前のビジョン言語モデルの可能性についての … 続きを読む

カテゴリー: cs.CV | Scaling Pre-training to One Hundred Billion Data for Vision Language Models はコメントを受け付けていません

Towards Single-Lens Controllable Depth-of-Field Imaging via Depth-Aware Point Spread Functions

要約 制御可能なディープオブフィールド(DOF)イメージングは​​、一般に、重く … 続きを読む

カテゴリー: cs.CV, cs.RO, eess.IV, physics.optics | Towards Single-Lens Controllable Depth-of-Field Imaging via Depth-Aware Point Spread Functions はコメントを受け付けていません

Causal-Informed Contrastive Learning: Towards Bias-Resilient Pre-training under Concept Drift

要約 最上層データセットによって推進される大規模な対照的なトレーニングの進化は、 … 続きを読む

カテゴリー: cs.CV, cs.LG | Causal-Informed Contrastive Learning: Towards Bias-Resilient Pre-training under Concept Drift はコメントを受け付けていません

Divide and Merge: Motion and Semantic Learning in End-to-End Autonomous Driving

要約 環境とその変化を長期にわたって知覚することは、セマンティクスと動きという2 … 続きを読む

カテゴリー: cs.CV | Divide and Merge: Motion and Semantic Learning in End-to-End Autonomous Driving はコメントを受け付けていません

LP-DETR: Layer-wise Progressive Relations for Object Detection

要約 このホワイトペーパーでは、マルチスケールリレーションモデリングを通じてDE … 続きを読む

カテゴリー: cs.AI, cs.CV | LP-DETR: Layer-wise Progressive Relations for Object Detection はコメントを受け付けていません

FlexiCrackNet: A Flexible Pipeline for Enhanced Crack Segmentation with General Features Transfered from SAM

要約 自動亀裂セグメンテーションは、交通安全維持と構造の完全性システムにおけるイ … 続きを読む

カテゴリー: cs.CV | FlexiCrackNet: A Flexible Pipeline for Enhanced Crack Segmentation with General Features Transfered from SAM はコメントを受け付けていません

CILP-FGDI: Exploiting Vision-Language Model for Generalizable Person Re-Identification

要約 堅牢なクロスモーダル機能で知られる視覚言語モデルは、さまざまなコンピュータ … 続きを読む

カテゴリー: cs.CV | CILP-FGDI: Exploiting Vision-Language Model for Generalizable Person Re-Identification はコメントを受け付けていません

TransRef: Multi-Scale Reference Embedding Transformer for Reference-Guided Image Inpainting

要約 複雑なセマンティック環境と破損した画像の多様な穴パターンを完了するための入 … 続きを読む

カテゴリー: cs.CV | TransRef: Multi-Scale Reference Embedding Transformer for Reference-Guided Image Inpainting はコメントを受け付けていません

mWhisper-Flamingo for Multilingual Audio-Visual Noise-Robust Speech Recognition

要約 Audio-Visuual Speech Speech Septureat … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS | mWhisper-Flamingo for Multilingual Audio-Visual Noise-Robust Speech Recognition はコメントを受け付けていません