-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Metamorphic Testing for Pose Estimation Systems
要約 ポーズ推定システムは、スポーツ分析から家畜ケアまで、さまざまな分野で使用さ … 続きを読む
Wholly-WOOD: Wholly Leveraging Diversified-quality Labels for Weakly-supervised Oriented Object Detection
要約 コンパクトな回転境界ボックス(Rbox)を使用した視覚オブジェクトの方向を … 続きを読む
EmbodiedBench: Comprehensive Benchmarking Multi-modal Large Language Models for Vision-Driven Embodied Agents
要約 具体化されたエージェントを作成するためにマルチモーダルの大手言語モデル(M … 続きを読む
Heuristical Comparison of Vision Transformers Against Convolutional Neural Networks for Semantic Segmentation on Remote Sensing Imagery
要約 Vision Transformers(VIT)は最近、コンピュータービジ … 続きを読む
Opening Articulated Objects in the Real World
要約 以前に見えなかった環境で、以前に見えなかったオブジェクトで有能に動作できる … 続きを読む
DexTrack: Towards Generalizable Neural Tracking Control for Dexterous Manipulation from Human References
要約 人間の参照からの器用な操作のための一般化可能なニューラル追跡コントローラー … 続きを読む
Exploring the Potential of Encoder-free Architectures in 3D LMMs
要約 エンコーダーフリーのアーキテクチャは、2Dビジュアルドメインで事前に検討さ … 続きを読む
MME-CoT: Benchmarking Chain-of-Thought in Large Multimodal Models for Reasoning Quality, Robustness, and Efficiency
要約 チェーンオブシュート(COT)で質問に答えることで、大規模な言語モデル(L … 続きを読む
Better Embeddings with Coupled Adam
要約 それらの驚くべき能力にもかかわらず、LLMSは、異方性の望ましくないが理解 … 続きを読む
Surface Vision Mamba: Leveraging Bidirectional State Space Model for Efficient Spherical Manifold Representation
要約 注意ベースの方法は、従来の幾何学的深部学習(GDL)モデルを上回り、球状の … 続きを読む