-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
PACE: marrying generalization in PArameter-efficient fine-tuning with Consistency rEgularization
要約 Parameter-Efficient Fine-Tuning (PEFT … 続きを読む
Pre-trained Language Models Do Not Help Auto-regressive Text-to-Image Generation
要約 VQ-VAE などの画像トークナイザーの最近の進歩により、言語モデリングと … 続きを読む
Attention Prompting on Image for Large Vision-Language Models
要約 大規模言語モデル (LLM) と比較して、大規模視覚言語モデル (LVLM … 続きを読む
DreamWaltz-G: Expressive 3D Gaussian Avatars from Skeleton-Guided 2D Diffusion
要約 事前トレーニングされた 2D 拡散モデルとスコア蒸留サンプリング (SDS … 続きを読む
Molmo and PixMo: Open Weights and Open Data for State-of-the-Art Multimodal Models
要約 現在の最も先進的なマルチモーダル モデルは独自の仕様のままです。 最強のオ … 続きを読む
Efficient Motion Prediction: A Lightweight & Accurate Trajectory Prediction Model With Fast Training and Inference Speed
要約 効率的かつ安全な自動運転のためには、自動運転車両が他の交通エージェントの動 … 続きを読む
A Computer Vision Approach for Autonomous Cars to Drive Safe at Construction Zone
要約 よりスマートで安全な都市を構築するには、安全で効率的で持続可能な交通システ … 続きを読む
Toward Unified Practices in Trajectory Prediction Research on Drone Datasets
要約 高品質のデータセットの利用可能性は、自動運転車の挙動予測アルゴリズムの開発 … 続きを読む
TinyVLA: Towards Fast, Data-Efficient Vision-Language-Action Models for Robotic Manipulation
要約 視覚-言語-動作 (VLA) モデルは、エンドツーエンドの学習プロセスを通 … 続きを読む
Enhanced Unsupervised Image-to-Image Translation Using Contrastive Learning and Histogram of Oriented Gradients
要約 画像から画像への変換は、コアの内容と構造を維持しながら、画像を 1 つの視 … 続きを読む