-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
DiffusionDrive: Truncated Diffusion Model for End-to-End Autonomous Driving
要約 最近、拡散モデルは、マルチモードアクション分布をモデル化できるロボットポリ … 続きを読む
Humanoid Policy ~ Human Policy
要約 さまざまなデータを使用したヒューマノイドロボットのトレーニング操作ポリシー … 続きを読む
CarPlanner: Consistent Auto-regressive Trajectory Planning for Large-scale Reinforcement Learning in Autonomous Driving
要約 軌道計画は、自律的な運転に不可欠であり、複雑な環境での安全で効率的なナビゲ … 続きを読む
ETAP: Event-based Tracking of Any Point
要約 任意のポイント(TAP)を追跡すると、最近、モーション推定パラダイムが個々 … 続きを読む
Kalib: Easy Hand-Eye Calibration with Reference Point Tracking
要約 ハンドアイキャリブレーションは、カメラとロボット間の変換を推定することを目 … 続きを読む
Robust Tube-based Control Strategy for Vision-guided Autonomous Vehicles
要約 自律車両の堅牢な制御戦略は、システムの安定性を改善し、ライディングの快適さ … 続きを読む
DUNE: Distilling a Universal Encoder from Heterogeneous 2D and 3D Teachers
要約 最近のマルチティーチャー蒸留方法により、複数の基礎モデルのエンコーダーが単 … 続きを読む
Beyond Training: Dynamic Token Merging for Zero-Shot Video Understanding
要約 マルチモーダル大手言語モデル(MLLM)の最近の進歩により、ビデオ理解のた … 続きを読む
Global-Local Tree Search for Language Guided 3D Scene Generation
要約 GPT-4などの大きなビジョン言語モデル(VLM)は、さまざまな分野で顕著 … 続きを読む
LLM Post-Training: A Deep Dive into Reasoning Large Language Models
要約 大規模な言語モデル(LLM)は、自然言語処理環境を変え、多様なアプリケーシ … 続きを読む