-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Event-based vision for egomotion estimation using precise event timing
要約 エゴモーション推定は、正確かつリアルタイムのモーション追跡が必要な自律ナビ … 続きを読む
GenEx: Generating an Explorable World
要約 3D の物理的な現実世界を理解し、ナビゲートし、探索することは、長い間、人 … 続きを読む
Transformer-Based Model for Monocular Visual Odometry: A Video Understanding Approach
要約 単一のカメラからの画像からカメラの姿勢を推定することは、移動ロボットや自律 … 続きを読む
DCPI-Depth: Explicitly Infusing Dense Correspondence Prior to Unsupervised Monocular Depth Estimation
要約 最近、教師なしの方法で単眼ビデオから奥行きを知覚する方法を学ぶことへの関心 … 続きを読む
Towards autonomous photogrammetric forest inventory using a lightweight under-canopy robotic drone
要約 林業では、高解像度のリモートセンシングデータを取得するためにドローンの使用 … 続きを読む
A margin-based replacement for cross-entropy loss
要約 クロスエントロピー (CE) 損失は、ディープ ニューラル ネットワークを … 続きを読む
FLAME: Learning to Navigate with Multimodal LLM in Urban Environments
要約 大規模言語モデル (LLM) は、視覚と言語のナビゲーション (VLN) … 続きを読む
Evolver: Chain-of-Evolution Prompting to Boost Large Multimodal Models for Hateful Meme Detection
要約 最近の進歩により、2 つのストリームのアプローチが憎悪ミームの検出において … 続きを読む
Survey on Hand Gesture Recognition from Visual Input
要約 手話認識、仮想現実および拡張現実、ロボット工学などの分野における人間とコン … 続きを読む
Adaptive Class Learning to Screen Diabetic Disorders in Fundus Images of Eye
要約 眼疾患の有病率は世界的に増加しており、公衆衛生上の大きな課題となっています … 続きを読む