-
最近の投稿
- Learning 3D Perception from Others’ Predictions
- Tokenization Falling Short: On Subword Robustness in Large Language Models
- Video Instruction Tuning With Synthetic Data
- StorySparkQA: Expert-Annotated QA Pairs with Real-World Knowledge for Children’s Story-Based Learning
- Justice or Prejudice? Quantifying Biases in LLM-as-a-Judge
-
最近のコメント
表示できるコメントはありません。 cs.AI (27643) cs.CL (20884) cs.CR (2168) cs.CV (34378) cs.LG (32374) cs.RO (15816) cs.SY (2460) eess.IV (4221) eess.SY (2454) stat.ML (4339)
「cs.CV」カテゴリーアーカイブ
VideoPatchCore: An Effective Method to Memorize Normality for Video Anomaly Detection
要約 ビデオ異常検出 (VAD) は、コンピューター ビジョン内のビデオ分析と監 … 続きを読む
UniEmoX: Cross-modal Semantic-Guided Large-Scale Pretraining for Universal Scene Emotion Perception
要約 視覚的感情分析は、コンピューター ビジョンと心理学の両方において重要な研究 … 続きを読む
DeRainGS: Gaussian Splatting for Enhanced Scene Reconstruction in Rainy Environments
要約 雨の悪条件下での再建は、視界の低下と視覚認識の歪みにより、重大な課題を引き … 続きを読む
3D Diffusion Policy: Generalizable Visuomotor Policy Learning via Simple 3D Representations
要約 模倣学習はロボットに器用なスキルを教える効率的な方法を提供します。 ただし … 続きを読む
DynaWeightPnP: Toward global real-time 3D-2D solver in PnP without correspondences
要約 この論文では、特殊な Perspective-n-Point (PnP) … 続きを読む
Compact 3D Gaussian Splatting For Dense Visual SLAM
要約 最近の研究では、3D ガウス ベースの SLAM により、高品質の再構成、 … 続きを読む
TOP-Nav: Legged Navigation Integrating Terrain, Obstacle and Proprioception Estimation
要約 脚式ナビゲーションは通常、オープンワールド、オフロード、および困難な環境内 … 続きを読む
From One to the Power of Many: Augmentations for Invariance to Multi-LiDAR Perception from Single-Sensor Datasets
要約 最近、ディープ ニューラル ネットワークを活用した自動運転車用の LiDA … 続きを読む
FracGM: A Fast Fractional Programming Technique for Geman-McClure Robust Estimator
要約 コンピューター ビジョン、ロボット工学、ナビゲーションでは確実な推定が不可 … 続きを読む
TinyVLA: Towards Fast, Data-Efficient Vision-Language-Action Models for Robotic Manipulation
要約 視覚-言語-動作 (VLA) モデルは、エンドツーエンドの学習プロセスを通 … 続きを読む