-
最近の投稿
- FaVoR: Features via Voxel Rendering for Camera Relocalization
- Learning Reward and Policy Jointly from Demonstration and Preference Improves Alignment
- Continual Learning and Lifting of Koopman Dynamics for Linear Control of Legged Robots
- InterHub: A Naturalistic Trajectory Dataset with Dense Interaction for Autonomous Driving
- Nl2Hltl2Plan: Scaling Up Natural Language Understanding for Multi-Robots Through Hierarchical Temporal Logic Task Representation
-
最近のコメント
表示できるコメントはありません。 cs.AI (30383) cs.CL (22961) cs.CR (2361) cs.CV (36763) cs.LG (35252) cs.RO (17684) cs.SY (2715) eess.IV (4466) eess.SY (2709) stat.ML (4693)
「cs.CV」カテゴリーアーカイブ
Object-Size-Driven Design of Convolutional Neural Networks: Virtual Axle Detection based on Raw Data
要約 インフラストラクチャが老朽化するにつれて、効率的な監視方法の必要性がますま … 続きを読む
Image Statistics Predict the Sensitivity of Perceptual Quality Metrics
要約 以前、バーローとアトニーブは、生物学的視覚と情報の最大化との間に関連性があ … 続きを読む
Improved Multi-Task Brain Tumour Segmentation with Synthetic Data Augmentation
要約 このペーパーでは、BraTS チャレンジのタスク 1 の優勝ソリューション … 続きを読む
Anticipating Object State Changes in Long Procedural Videos
要約 この研究では、(a) 手続き中の画像やビデオにおけるオブジェクトの状態変化 … 続きを読む
Real-time Transformer-based Open-Vocabulary Detection with Efficient Fusion Head
要約 エンドツーエンドのトランスフォーマーベース検出器 (DETR) は、言語モ … 続きを読む
An Architectural Approach to Enhance Deep Long-Tailed Learning
要約 深いロングテール認識は、現実世界のシナリオにおける不均衡なデータ分布の問題 … 続きを読む
Revisiting MAE pre-training for 3D medical image segmentation
要約 自己教師あり学習 (SSL) は、ラベル付きデータの不足に悩まされているさ … 続きを読む
VQA$^2$: Visual Question Answering for Video Quality Assessment
要約 大規模マルチモーダル モデル (LMM) の出現と普及により、コンピュータ … 続きを読む
A Survey and Benchmark of Automatic Surface Reconstruction from Point Clouds
要約 点群から表面を再構築するための従来の方法と学習ベースの方法の両方の包括的な … 続きを読む
AniFaceDiff: Animating Stylized Avatars via Parametric Conditioned Diffusion Models
要約 ダイナミックなポーズや表情を備えた様式化されたアバターのアニメーション化は … 続きを読む