-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
AugMapNet: Improving Spatial Latent Structure via BEV Grid Augmentation for Enhanced Vectorized Online HD Map Construction
要約 自律運転には、レーンや横断歩道などのインフラストラクチャ要素を理解する必要 … 続きを読む
BlobCtrl: A Unified and Flexible Framework for Element-level Image Generation and Editing
要約 要素レベルの視覚操作はデジタルコンテンツの作成に不可欠ですが、現在の拡散ベ … 続きを読む
Humanoid Policy ~ Human Policy
要約 さまざまなデータを使用したヒューマノイドロボットのトレーニング操作ポリシー … 続きを読む
VideoMind: A Chain-of-LoRA Agent for Long Video Reasoning
要約 独自の時間的次元を備えたビデオは、回答が視覚的で解釈可能な証拠に直接リンク … 続きを読む
Training Directional Locomotion for Quadrupedal Low-Cost Robotic Systems via Deep Reinforcement Learning
要約 この作業では、現実の世界の低コスト四足動物ロボットの方向移動のディープ補強 … 続きを読む
Low-cost Real-world Implementation of the Swing-up Pendulum for Deep Reinforcement Learning Experiments
要約 Deep Rehnection Learning(DRL)は仮想ドメインと … 続きを読む
MoMa-Kitchen: A 100K+ Benchmark for Affordance-Grounded Last-Mile Navigation in Mobile Manipulation
要約 モバイル操作では、ナビゲーションと操作はしばしば別々の問題として扱われ、そ … 続きを読む
EmbodiedVSR: Dynamic Scene Graph-Guided Chain-of-Thought Reasoning for Visual Spatial Tasks
要約 マルチモーダルの大手言語モデル(MLLM)は、具体化された知性を画期的に進 … 続きを読む
Virtual Guidance as a Mid-level Representation for Navigation with Augmented Reality
要約 自律的なナビゲーションのコンテキストでは、特にナビゲーション情報がビジョン … 続きを読む
LIX: Implicitly Infusing Spatial Geometric Prior Knowledge into Visual Semantic Segmentation for Autonomous Driving
要約 視覚セマンティックセグメンテーションのために二重エンコーダを使用してデータ … 続きを読む