cs.CV」カテゴリーアーカイブ

Do ImageNet-trained models learn shortcuts? The impact of frequency shortcuts on generalization

要約 周波数のショートカットは、正しい分類のために大きく依存している特定の周波数 … 続きを読む

カテゴリー: cs.CV | コメントする

ArtNVG: Content-Style Separated Artistic Neighboring-View Gaussian Stylization

要約 ターゲットスタイルを備えた3Dシーンの映画やゲーム業界からの需要が高まるに … 続きを読む

カテゴリー: cs.CV | コメントする

AdaSin: Enhancing Hard Sample Metrics with Dual Adaptive Penalty for Face Recognition

要約 近年、深い畳み込みニューラルネットワークの出現により、コンピュータービジョ … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

GSplatLoc: Grounding Keypoint Descriptors into 3D Gaussian Splatting for Improved Visual Localization

要約 シーン座標の回帰やカメラは回帰をもたらすなど、さまざまな視覚的ローカリゼー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントする

LDPM: Towards undersampled MRI reconstruction with MR-VAE and Latent Diffusion Prior

要約 拡散モデルは、強力な生成モデルとして、幅広いアプリケーションを発見し、画像 … 続きを読む

カテゴリー: cs.CV, eess.IV | コメントする

Unified Human Localization and Trajectory Prediction with Monocular Vision

要約 従来の人間の軌道予測モデルは、クリーンなキュレーションされたデータに依存し … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする

BHViT: Binarized Hybrid Vision Transformer

要約 モデルのバイナリゼーションは、畳み込みニューラルネットワーク(CNN)のリ … 続きを読む

カテゴリー: cs.CV | コメントする

A self-supervised cyclic neural-analytic approach for novel view synthesis and 3D reconstruction

要約 録画されたビデオから新しいビューを生成することは、自律的なUAVナビゲーシ … 続きを読む

カテゴリー: cs.CV, I.2.10 | コメントする

Deblur-Avatar: Animatable Avatars from Motion-Blurred Monocular Videos

要約 運動式モノクーラービデオ入力からの高忠実度のある3Dヒトアバターをモデル化 … 続きを読む

カテゴリー: cs.CV | コメントする

Simulation-Based Performance Evaluation of 3D Object Detection Methods with Deep Learning for a LiDAR Point Cloud Dataset in a SOTIF-related Use Case

要約 意図した機能(SOTIF)の安全性は、センサーのパフォーマンスの制限と、自 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.SY, eess.SY | コメントする