-
最近の投稿
- The Spinning Blimp: Design and Control of a Novel Minimalist Aerial Vehicle Leveraging Rotational Dynamics and Locomotion
- Dur360BEV: A Real-world 360-degree Single Camera Dataset and Benchmark for Bird-Eye View Mapping in Autonomous Driving
- GAGrasp: Geometric Algebra Diffusion for Dexterous Grasping
- DVM-SLAM: Decentralized Visual Monocular Simultaneous Localization and Mapping for Multi-Agent Systems
- Real-time Spatial-temporal Traversability Assessment via Feature-based Sparse Gaussian Process
-
最近のコメント
表示できるコメントはありません。 cs.AI (34738) cs.CL (26263) cs.CR (2664) cs.CV (40572) cs.LG (39741) cs.RO (20348) cs.SY (3091) eess.IV (4818) eess.SY (3085) stat.ML (5229)
「cs.CV」カテゴリーアーカイブ
Mineral segmentation using electron microscope images and spectral sampling through multimodal graph neural networks
要約 マルチモーダルスキャン電子顕微鏡(SEM)画像のデータ融合に基づいて、セグ … 続きを読む
Multimodal Action Quality Assessment
要約 アクション品質評価(AQA)は、アクションがどれだけうまく実行されるかを評 … 続きを読む
Do ImageNet-trained models learn shortcuts? The impact of frequency shortcuts on generalization
要約 周波数のショートカットは、正しい分類のために大きく依存している特定の周波数 … 続きを読む
ArtNVG: Content-Style Separated Artistic Neighboring-View Gaussian Stylization
要約 ターゲットスタイルを備えた3Dシーンの映画やゲーム業界からの需要が高まるに … 続きを読む
AdaSin: Enhancing Hard Sample Metrics with Dual Adaptive Penalty for Face Recognition
要約 近年、深い畳み込みニューラルネットワークの出現により、コンピュータービジョ … 続きを読む
GSplatLoc: Grounding Keypoint Descriptors into 3D Gaussian Splatting for Improved Visual Localization
要約 シーン座標の回帰やカメラは回帰をもたらすなど、さまざまな視覚的ローカリゼー … 続きを読む
LDPM: Towards undersampled MRI reconstruction with MR-VAE and Latent Diffusion Prior
要約 拡散モデルは、強力な生成モデルとして、幅広いアプリケーションを発見し、画像 … 続きを読む
Unified Human Localization and Trajectory Prediction with Monocular Vision
要約 従来の人間の軌道予測モデルは、クリーンなキュレーションされたデータに依存し … 続きを読む
BHViT: Binarized Hybrid Vision Transformer
要約 モデルのバイナリゼーションは、畳み込みニューラルネットワーク(CNN)のリ … 続きを読む
A self-supervised cyclic neural-analytic approach for novel view synthesis and 3D reconstruction
要約 録画されたビデオから新しいビューを生成することは、自律的なUAVナビゲーシ … 続きを読む