-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
EqNIO: Subequivariant Neural Inertial Odometry
要約 現在、ニューラル ネットワークは、慣性測定ユニット (IMU) データから … 続きを読む
VisualAgentBench: Towards Large Multimodal Models as Visual Foundation Agents
要約 大規模マルチモーダル モデル (LMM) は、言語と視覚の両方の機能を統合 … 続きを読む
HeLiMOS: A Dataset for Moving Object Segmentation in 3D Point Clouds From Heterogeneous LiDAR Sensors
要約 3D 光検出測距 (LiDAR) センサーを使用した移動物体セグメンテーシ … 続きを読む
Moo-ving Beyond Tradition: Revolutionizing Cattle Behavioural Phenotyping with Pose Estimation Techniques
要約 畜牛産業は、米国やカナダを含む多くの国の経済に大きく貢献してきました。 人 … 続きを読む
カテゴリー: cs.CV
Moo-ving Beyond Tradition: Revolutionizing Cattle Behavioural Phenotyping with Pose Estimation Techniques はコメントを受け付けていません
Visual Representation Learning with Stochastic Frame Prediction
要約 将来のフレームを予測することによる画像表現の自己教師あり学習は有望な方向性 … 続きを読む
Embodied Uncertainty-Aware Object Segmentation
要約 不確実性を認識したオブジェクト インスタンス セグメンテーション (Unc … 続きを読む
Track2Act: Predicting Point Tracks from Internet Videos enables Generalizable Robot Manipulation
要約 私たちは、ゼロショットのロボット操作、つまりテスト時の適応なしで新しいシー … 続きを読む
Diffusion Reward: Learning Rewards via Conditional Video Diffusion
要約 エキスパート ビデオからの学習報酬は、強化学習 (RL) タスクの意図され … 続きを読む
Towards Consistent Object Detection via LiDAR-Camera Synergy
要約 人間と機械の相互作用が進化し続けるにつれて、環境を認識する能力がますます重 … 続きを読む
Surveying the Landscape of Image Captioning Evaluation: A Comprehensive Taxonomy and Novel Ensemble Method
要約 画像キャプションのタスクは最近人気が高まっており、それに伴い、画像キャプシ … 続きを読む