-
最近の投稿
- Autonomous Vision-Guided Resection of Central Airway Obstruction
- A Distributional Treatment of Real2Sim2Real for Vision-Driven Deformable Linear Object Manipulation
- Rapidly Built Medical Crash Cart! Lessons Learned and Impacts on High-Stakes Team Collaboration in the Emergency Room
- Hybrid Voting-Based Task Assignment in Role-Playing Games
- Interpretable Data-Driven Ship Dynamics Model: Enhancing Physics-Based Motion Prediction with Parameter Optimization
-
最近のコメント
表示できるコメントはありません。 cs.AI (34317) cs.CL (25942) cs.CR (2635) cs.CV (40201) cs.LG (39311) cs.RO (20037) cs.SY (3046) eess.IV (4788) eess.SY (3040) stat.ML (5183)
「68Q85」カテゴリーアーカイブ
MVTamperBench: Evaluating Robustness of Vision-Language Models
要約 マルチモーダル大規模言語モデル (MLLM) は、ビデオの理解において大き … 続きを読む
MVTamperBench: Evaluating Robustness of Vision-Language Models
要約 視覚言語モデル (VLM) の最近の進歩により、複雑なビデオ理解タスクが大 … 続きを読む
MVTamperBench: Evaluating Robustness of Vision-Language Models
要約 視覚言語モデル (VLM) の最近の進歩により、複雑なビデオ理解タスクが大 … 続きを読む
Benchmarking Edge Computing Devices for Grape Bunches and Trunks Detection using Accelerated Object Detection Single Shot MultiBox Deep Learning Models
要約 目的: 視覚により、ロボットは環境を認識できます。 視覚データは、コンピュ … 続きを読む