-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Real-time Seafloor Segmentation and Mapping
要約 Posidonia Oceanica Meadowsは、生存と保全のために … 続きを読む
ReasonDrive: Efficient Visual Question Answering for Autonomous Vehicles with Reasoning-Enhanced Small Vision-Language Models
要約 ビジョン言語モデル(VLM)は、自律運転の可能性を示していますが、多くの場 … 続きを読む
SeeTree — A modular, open-source system for tree detection and orchard localization
要約 正確なローカリゼーションは、精密な果樹園管理の重要な機能要件です。 ただし … 続きを読む
LanguageMPC: Large Language Models as Decision Makers for Autonomous Driving
要約 既存の学習ベースの自律運転(AD)システムは、高レベルの情報を理解し、まれ … 続きを読む
ZeroGrasp: Zero-Shot Shape Reconstruction Enabled Robotic Grasping
要約 ロボット把握は、具体化されたシステムの基礎能力です。 多くの方法は、シーン … 続きを読む
Reasoning in visual navigation of end-to-end trained agents: a dynamical systems approach
要約 具体化されたAIの進歩により、エンドツーエンドの訓練を受けたエージェントが … 続きを読む
Acquisition of high-quality images for camera calibration in robotics applications via speech prompts
要約 正確な固有および外因性カメラのキャリブレーションは、視力に依存するロボット … 続きを読む
Using LLMs as prompt modifier to avoid biases in AI image generators
要約 この調査では、ユーザープロンプトを変更することにより、テキストから画像の生 … 続きを読む
What Is a Good Caption? A Comprehensive Visual Caption Benchmark for Evaluating Both Correctness and Thoroughness
要約 視覚的なキャプションベンチマークは、現代のマルチモーダル大手言語モデル(M … 続きを読む
CAP-Net: A Unified Network for 6D Pose and Size Estimation of Categorical Articulated Parts from a Single RGB-D Image
要約 このペーパーは、ロボット操作タスクにおける明確なオブジェクトのカテゴリレベ … 続きを読む