-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
CODEI: Resource-Efficient Task-Driven Co-Design of Perception and Decision Making for Mobile Robots Applied to Autonomous Vehicles
要約 このペーパーでは、安全性、効率、コスト、エネルギー、計算要件、重量などのリ … 続きを読む
ReVLA: Reverting Visual Domain Limitation of Robotic Foundation Models
要約 大規模な言語モデルの最近の進歩と大規模なロボットデータセットへのアクセスは … 続きを読む
6D Object Pose Tracking in Internet Videos for Robotic Manipulation
要約 インターネットの指導ビデオから操作されたオブジェクトの一時的に一貫した6D … 続きを読む
LUMOS: Language-Conditioned Imitation Learning with World Models
要約 ロボット工学のための言語条件付きマルチタスク模倣学習フレームワークであるL … 続きを読む
Finetuning Generative Trajectory Model with Reinforcement Learning from Human Feedback
要約 動的環境での自律運転には、人間のような適応軌道を生成することが不可欠です。 … 続きを読む
OODD: Test-time Out-of-Distribution Detection with Dynamic Dictionary
要約 特にテスト時のOODサンプルがトレーニングの外れ値と大きく異なる場合、ディ … 続きを読む
Streaming Generation of Co-Speech Gestures via Accelerated Rolling Diffusion
要約 リアルタイムでの共同スピーチジェスチャーを生成するには、時間的一貫性と効率 … 続きを読む
Video Super-Resolution: All You Need is a Video Diffusion Model
要約 潜在空間に無条件のビデオ生成モデルを備えた拡散後サンプリングフレームワーク … 続きを読む
VisualPRM: An Effective Process Reward Model for Multimodal Reasoning
要約 8Bパラメーターを備えた高度なマルチモーダルプロセス報酬モデル(PRM)で … 続きを読む