-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
OpenLKA: An Open Dataset of Lane Keeping Assist from Recent Car Models under Real-world Driving Conditions
要約 Lane Keeping Assist(LKA)は現代の車両で広く採用され … 続きを読む
FoldNet: Learning Generalizable Closed-Loop Policy for Garment Folding via Keypoint-Driven Asset and Demonstration Synthesis
要約 衣服の変形性により、ロボット衣服操作タスクのために大量の高品質データを生成 … 続きを読む
AdaWorld: Learning Adaptable World Models with Latent Actions
要約 世界モデルは、アクション制御された将来の予測を学ぶことを目指しており、イン … 続きを読む
METDrive: Multi-modal End-to-end Autonomous Driving with Temporal Guidance
要約 マルチモーダルエンドツーエンドの自律運転は、最近の研究で有望な進歩を示して … 続きを読む
TransDiffuser: End-to-end Trajectory Generation with Decorrelated Multi-modal Representation for Autonomous Driving
要約 近年、拡散モデルは、ビジョン生成から言語モデリングまで、多様なドメイン全体 … 続きを読む
Behind Maya: Building a Multilingual Vision Language Model
要約 最近では、大規模なビジョン言語モデル(VLM)の急速な発展が見られました。 … 続きを読む
Prioritizing Image-Related Tokens Enhances Vision-Language Pre-Training
要約 トレーニング前の標準的な大きな視覚言語モデル(LVLMS)では、モデルは通 … 続きを読む
BioVFM-21M: Benchmarking and Scaling Self-Supervised Vision Foundation Models for Biomedical Image Analysis
要約 モデルとデータサイズのスケーリングにより、幅広いタスクよりも印象的なパフォ … 続きを読む
DCSNet: A Lightweight Knowledge Distillation-Based Model with Explainable AI for Lung Cancer Diagnosis from Histopathological Images
要約 肺がんは、生存率を改善するために早期発見と正確な診断が重要である世界的に癌 … 続きを読む
Unsupervised Multiview Contrastive Language-Image Joint Learning with Pseudo-Labeled Prompts Via Vision-Language Model for 3D/4D Facial Expression Recognition
要約 このペーパーでは、3D/4Dデータからの顔の感情の監視されていない対照的な … 続きを読む
カテゴリー: cs.CV
Unsupervised Multiview Contrastive Language-Image Joint Learning with Pseudo-Labeled Prompts Via Vision-Language Model for 3D/4D Facial Expression Recognition はコメントを受け付けていません