-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「I.2.10」カテゴリーアーカイブ
CoMatcher: Multi-View Collaborative Feature Matching
要約 このペーパーでは、複雑なシナリオでの信頼できるトラック構造のためのマルチビ … 続きを読む
Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models
要約 自律運転における共変量シフト問題に対処するために、潜在空間生成世界モデルの … 続きを読む
Harmony: A Joint Self-Supervised and Weakly-Supervised Framework for Learning General Purpose Visual Representations
要約 クリップなどのビジョン言語対照学習フレームワークは、自然言語の監督から学習 … 続きを読む
GroundCap: A Visually Grounded Image Captioning Dataset
要約 現在の画像キャプションシステムには、説明テキストを特定の視覚要素にリンクす … 続きを読む
Conjuring Positive Pairs for Efficient Unification of Representation Learning and Image Synthesis
要約 表現学習と生成モデリングは視覚データを理解しようとしていますが、両方のドメ … 続きを読む
CODEI: Resource-Efficient Task-Driven Co-Design of Perception and Decision Making for Mobile Robots Applied to Autonomous Vehicles
要約 このペーパーでは、安全性、効率、コスト、エネルギー、計算要件、重量などのリ … 続きを読む
ForAug: Recombining Foregrounds and Backgrounds to Improve Vision Transformer Training with Bias Mitigation
要約 トランス、特にビジョントランス(VITS)は、大規模な画像分類で最先端のパ … 続きを読む
VisRL: Intention-Driven Visual Perception via Reinforced Reasoning
要約 視覚的理解は本質的に意図駆動型です – 人間は目標に基づいてシ … 続きを読む
NeuGrasp: Generalizable Neural Surface Reconstruction with Background Priors for Material-Agnostic Object Grasp Detection
要約 透明性と鏡面オブジェクトを使用したシーンでのロボット把握は、正確な深さ情報 … 続きを読む