-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Evolutionary Caching to Accelerate Your Off-the-Shelf Diffusion Model
要約 拡散ベースの画像生成モデルは、高品質の合成含有量の生成に優れていますが、ゆ … 続きを読む
Nabla-R2D3: Effective and Efficient 3D Diffusion Alignment with 2D Rewards
要約 3Dビジョンとコンピューターグラフィックスでは、高品質で光リアリスティック … 続きを読む
YOLOv11-RGBT: Towards a Comprehensive Single-Stage Multispectral Object Detection Framework
要約 複数のバンドからの情報を統合するマルチスペクトルオブジェクトの検出は、検出 … 続きを読む
AMPLIFY: Actionless Motion Priors for Robot Learning from Videos
要約 ロボット工学のアクション標識データは不足して高価であり、学習ポリシーの一般 … 続きを読む
SmartWay: Enhanced Waypoint Prediction and Backtracking for Zero-Shot Vision-and-Language Navigation
要約 継続的な環境でのビジョンと言語のナビゲーション(VLN)には、制約のない3 … 続きを読む
H$^3$DP: Triply-Hierarchical Diffusion Policy for Visuomotor Learning
要約 視覚運動の政策学習は、ロボット操作の大きな進歩を目撃しており、最近のアプロ … 続きを読む
Foundation Model Insights and a Multi-Model Approach for Superior Fine-Grained One-shot Subset Selection
要約 ワンショットサブセット選択は、情報抽出器(つまり)によって抽出された情報に … 続きを読む
DexHandDiff: Interaction-aware Diffusion Planning for Adaptive Dexterous Manipulation
要約 高度なロボット工学にとって、接触豊富な相互作用による器用な操作が重要です。 … 続きを読む
FlowAlign: Trajectory-Regularized, Inversion-Free Flow-based Image Editing
要約 Floweditなどのフローベースの画像編集方法は、安定した拡散3などの事 … 続きを読む
I Speak and You Find: Robust 3D Visual Grounding with Noisy and Ambiguous Speech Inputs
要約 既存の3Dビジュアル接地方法は、3Dシーン内でオブジェクトを見つけるために … 続きを読む
カテゴリー: cs.CV
I Speak and You Find: Robust 3D Visual Grounding with Noisy and Ambiguous Speech Inputs はコメントを受け付けていません