-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Flow Distillation Sampling: Regularizing 3D Gaussians with Pre-trained Matching Priors
要約 3D Gaussian Splatting(3DGS)は、高速トレーニング … 続きを読む
カテゴリー: cs.CV
Flow Distillation Sampling: Regularizing 3D Gaussians with Pre-trained Matching Priors はコメントを受け付けていません
Scaling Pre-training to One Hundred Billion Data for Vision Language Models
要約 前例のないスケールでのトレーニング前のビジョン言語モデルの可能性についての … 続きを読む
カテゴリー: cs.CV
Scaling Pre-training to One Hundred Billion Data for Vision Language Models はコメントを受け付けていません
Towards Single-Lens Controllable Depth-of-Field Imaging via Depth-Aware Point Spread Functions
要約 制御可能なディープオブフィールド(DOF)イメージングは、一般に、重く … 続きを読む
カテゴリー: cs.CV, cs.RO, eess.IV, physics.optics
Towards Single-Lens Controllable Depth-of-Field Imaging via Depth-Aware Point Spread Functions はコメントを受け付けていません
Causal-Informed Contrastive Learning: Towards Bias-Resilient Pre-training under Concept Drift
要約 最上層データセットによって推進される大規模な対照的なトレーニングの進化は、 … 続きを読む
Divide and Merge: Motion and Semantic Learning in End-to-End Autonomous Driving
要約 環境とその変化を長期にわたって知覚することは、セマンティクスと動きという2 … 続きを読む
カテゴリー: cs.CV
Divide and Merge: Motion and Semantic Learning in End-to-End Autonomous Driving はコメントを受け付けていません
LP-DETR: Layer-wise Progressive Relations for Object Detection
要約 このホワイトペーパーでは、マルチスケールリレーションモデリングを通じてDE … 続きを読む
FlexiCrackNet: A Flexible Pipeline for Enhanced Crack Segmentation with General Features Transfered from SAM
要約 自動亀裂セグメンテーションは、交通安全維持と構造の完全性システムにおけるイ … 続きを読む
カテゴリー: cs.CV
FlexiCrackNet: A Flexible Pipeline for Enhanced Crack Segmentation with General Features Transfered from SAM はコメントを受け付けていません
CILP-FGDI: Exploiting Vision-Language Model for Generalizable Person Re-Identification
要約 堅牢なクロスモーダル機能で知られる視覚言語モデルは、さまざまなコンピュータ … 続きを読む
カテゴリー: cs.CV
CILP-FGDI: Exploiting Vision-Language Model for Generalizable Person Re-Identification はコメントを受け付けていません
TransRef: Multi-Scale Reference Embedding Transformer for Reference-Guided Image Inpainting
要約 複雑なセマンティック環境と破損した画像の多様な穴パターンを完了するための入 … 続きを読む
カテゴリー: cs.CV
TransRef: Multi-Scale Reference Embedding Transformer for Reference-Guided Image Inpainting はコメントを受け付けていません
mWhisper-Flamingo for Multilingual Audio-Visual Noise-Robust Speech Recognition
要約 Audio-Visuual Speech Speech Septureat … 続きを読む