-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Survey on Vision-Language-Action Models
要約 このペーパーでは、Vision-Language-action(VLA)モ … 続きを読む
I see what you mean: Co-Speech Gestures for Reference Resolution in Multimodal Dialogue
要約 対面の相互作用では、音声やジェスチャーを含む複数のモダリティを使用して、情 … 続きを読む
Beyond Pretty Pictures: Combined Single- and Multi-Image Super-resolution for Sentinel-2 Images
要約 スーパー解像度の目的は、高周波の詳細を再構築することにより、衛星画像の解像 … 続きを読む
ChatVLA-2: Vision-Language-Action Model with Open-World Embodied Reasoning from Pretrained Knowledge
要約 Vision-Language-action(VLA)モデルは、ロボット工 … 続きを読む
Towards a Generalizable Bimanual Foundation Policy via Flow-based Video Prediction
要約 一般化可能な二近操作ポリシーを学ぶことは、大きなアクションスペースと調整さ … 続きを読む
SR3D: Unleashing Single-view 3D Reconstruction for Transparent and Specular Object Grasping
要約 3Dロボット操作の最近の進歩により、日常のオブジェクトの把握が改善されまし … 続きを読む
Black-box Adversarial Attacks on CNN-based SLAM Algorithms
要約 深い学習の継続的な進歩により、機能検出が大幅に進歩し、同時ローカリゼーショ … 続きを読む
HEIE: MLLM-Based Hierarchical Explainable AIGC Image Implausibility Evaluator
要約 AIGC画像はさまざまな分野で普及していますが、アーティファクトや不自然な … 続きを読む
Conformal Prediction for Zero-Shot Models
要約 大規模に事前に訓練されたビジョン言語モデルは、下流タスクに対する前例のない … 続きを読む
カテゴリー: cs.CV
Conformal Prediction for Zero-Shot Models はコメントを受け付けていません
Adversarial Pruning: A Survey and Benchmark of Pruning Methods for Adversarial Robustness
要約 最近の研究では、ネットワークのサイズを縮小しながら、敵対的な例、つまり誤分 … 続きを読む