-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Rethinking Few-Shot Adaptation of Vision-Language Models in Two Stages
要約 An old-school recipe for training a c … 続きを読む
TreeMeshGPT: Artistic Mesh Generation with Autoregressive Tree Sequencing
要約 Treemeshgptを紹介します。Treemeshgptは、入力ポイント … 続きを読む
Seeing and Seeing Through the Glass: Real and Synthetic Data for Multi-Layer Depth Estimation
要約 透明なオブジェクトは日常生活で一般的であり、透明な表面とその背後にあるオブ … 続きを読む
カテゴリー: cs.CV
Seeing and Seeing Through the Glass: Real and Synthetic Data for Multi-Layer Depth Estimation はコメントを受け付けていません
Filter, Correlate, Compress: Training-Free Token Reduction for MLLM Acceleration
要約 シーケンスの長さに関するマルチモーダル大手言語モデル(MLLM)の2次複雑 … 続きを読む
カテゴリー: cs.CV
Filter, Correlate, Compress: Training-Free Token Reduction for MLLM Acceleration はコメントを受け付けていません
ReCamMaster: Camera-Controlled Generative Rendering from A Single Video
要約 カメラ制御は、テキストまたは画像条件付けられたビデオ生成タスクで積極的に研 … 続きを読む
カテゴリー: cs.CV
ReCamMaster: Camera-Controlled Generative Rendering from A Single Video はコメントを受け付けていません
Centaur: Robust End-to-End Autonomous Driving with Test-Time Training
要約 展開中にエンドツーエンドの自動運転車の複雑な意思決定システムにどのように依 … 続きを読む
VGGT: Visual Geometry Grounded Transformer
要約 VGGTは、カメラパラメーター、ポイントマップ、深度マップ、3Dポイントト … 続きを読む
カテゴリー: cs.CV
VGGT: Visual Geometry Grounded Transformer はコメントを受け付けていません
Bring Your Rear Cameras for Egocentric 3D Human Pose Estimation
要約 エゴセントリック3Dヒトポーズ推定は、ヘッドマウントデバイス(HMD)の前 … 続きを読む
カテゴリー: cs.CV
Bring Your Rear Cameras for Egocentric 3D Human Pose Estimation はコメントを受け付けていません
Distilling Diversity and Control in Diffusion Models
要約 蒸留拡散モデルは、重大な制限に悩まされています。サンプルの多様性の低下と比 … 続きを読む
PEMF-VTO: Point-Enhanced Video Virtual Try-on via Mask-free Paradigm
要約 Video Virtual Try-Onは、視覚的な忠実度と時間的一貫性の … 続きを読む