-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Thinking vs. Doing: Agents that Reason by Scaling Test-Time Interaction
要約 テスト時間スケーリングの現在のパラダイムは、応答を生成する前に、長い推論ト … 続きを読む
From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models
要約 私たちの目的は、低レベルのスキルと、一連の画像を含む少数の短距離デモンスト … 続きを読む
Towards Autonomous Reinforcement Learning for Real-World Robotic Manipulation with Large Language Models
要約 大規模な言語モデル(LLMS)および視覚言語モデル(VLM)の最近の進歩は … 続きを読む
Imperative Learning: A Self-supervised Neuro-Symbolic Learning Framework for Robot Autonomy
要約 強化や模倣学習などのデータ駆動型の方法は、ロボットの自律性において顕著な成 … 続きを読む
Unifying 2D and 3D Vision-Language Understanding
要約 3Dビジョン言語学習の進歩は、大規模な3Dデータセットの希少性によって妨げ … 続きを読む
Real-Time Execution of Action Chunking Flow Policies
要約 最新のAIシステム、特に物理的な世界と相互作用するシステムは、リアルタイム … 続きを読む
From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models
要約 私たちの目的は、低レベルのスキルと、一連の画像を含む少数の短距離デモンスト … 続きを読む
Language-Grounded Hierarchical Planning and Execution with Multi-Robot 3D Scene Graphs
要約 このホワイトペーパーでは、3Dシーングラフで有効になったマッピング、ローカ … 続きを読む
MMScan: A Multi-Modal 3D Scene Dataset with Hierarchical Grounded Language Annotations
要約 LLMSの出現と他のデータモダリティとの統合により、マルチモーダル3D知覚 … 続きを読む
Curriculum Learning With Counterfactual Group Relative Policy Advantage For Multi-Agent Reinforcement Learning
要約 マルチエージェント補強学習(MARL)は、協力的な敵対的なタスクで強力なパ … 続きを読む