-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Promptable Closed-loop Traffic Simulation
要約 シミュレーションは、安全かつ効率的な自動運転開発の基礎となります。 シミュ … 続きを読む
Neural MP: A Generalist Neural Motion Planner
要約 現在の動作計画のパラダイムでは、新たな問題が発生するたびにソリューションを … 続きを読む
Flash Cache: Reducing Bias in Radiance Cache Based Inverse Rendering
要約 3D 再構成のための最先端の技術は主にボリューム シーン表現に基づいており … 続きを読む
HiSC4D: Human-centered interaction and 4D Scene Capture in Large-scale Space Using Wearable IMUs and LiDAR
要約 大規模な屋内と屋外のシーン、多様な人間の動き、豊かな人間と人間の相互作用、 … 続きを読む
Question-Answering Dense Video Events
要約 マルチモーダル大規模言語モデル (MLLM) は、単一イベント ビデオの質 … 続きを読む
HiPrompt: Tuning-free Higher-Resolution Generation with Hierarchical MLLM Prompts
要約 事前トレーニングされた拡散モデルを使用した高解像度画像生成の可能性は計り知 … 続きを読む
カテゴリー: cs.CV
HiPrompt: Tuning-free Higher-Resolution Generation with Hierarchical MLLM Prompts はコメントを受け付けていません
Diagram Formalization Enhanced Multi-Modal Geometry Problem Solver
要約 数学的推論は、AI モデル、特に言語信号と視覚信号の両方を必要とする幾何学 … 続きを読む
カテゴリー: cs.CV
Diagram Formalization Enhanced Multi-Modal Geometry Problem Solver はコメントを受け付けていません
Introducing a Class-Aware Metric for Monocular Depth Estimation: An Automotive Perspective
要約 メートル単位の単眼奥行き推定モデルのレポートの精度が向上しているため、自動 … 続きを読む
Hyp2Nav: Hyperbolic Planning and Curiosity for Crowd Navigation
要約 自律型ロボットは社会環境においてますます有力な存在となりつつあります。 効 … 続きを読む
White-Box Transformers via Sparse Rate Reduction: Compression Is All There Is?
要約 この論文では、表現学習の自然な目的は、データの分布、たとえばトークンのセッ … 続きを読む