-
最近の投稿
- Topological mapping for traversability-aware long-range navigation in off-road terrain
- Equality Constrained Diffusion for Direct Trajectory Optimization
- Learning-Based Autonomous Navigation, Benchmark Environments and Simulation Framework for Endovascular Interventions
- Language Supervised Human Action Recognition with Salient Fusion: Construction Worker Action Recognition as a Use Case
- Bi-Level Motion Imitation for Humanoid Robots
-
最近のコメント
表示できるコメントはありません。 cs.AI (27641) cs.CL (20879) cs.CR (2167) cs.CV (34375) cs.LG (32373) cs.RO (15816) cs.SY (2460) eess.IV (4221) eess.SY (2454) stat.ML (4339)
「cs.CV」カテゴリーアーカイブ
Inverse Painting: Reconstructing The Painting Process
要約 入力された絵画が与えられると、それがどのように描かれたかを示すタイムラプス … 続きを読む
Propose, Assess, Search: Harnessing LLMs for Goal-Oriented Planning in Instructional Videos
要約 目標指向の計画、つまりエージェントを現在の状態から事前定義された目標に移行 … 続きを読む
Uni$^2$Det: Unified and Universal Framework for Prompt-Guided Multi-dataset 3D Detection
要約 Uni$^2$Det は、3D 検出に関する統合された普遍的なマルチデータ … 続きを読む
Supervised Multi-Modal Fission Learning
要約 マルチモーダル データセットから学習すると、補完的な情報を活用し、予測タス … 続きを読む
SpaceMesh: A Continuous Representation for Learning Manifold Surface Meshes
要約 メッシュはビジュアル コンピューティングやシミュレーションで広く使われてい … 続きを読む
DressRecon: Freeform 4D Human Reconstruction from Monocular Video
要約 極端にゆるい衣服や手持ちの物体の相互作用に焦点を当て、単眼ビデオから時間一 … 続きを読む
MM1.5: Methods, Analysis & Insights from Multimodal LLM Fine-tuning
要約 MM1.5 は、テキストが豊富な画像の理解、視覚的な参照とグラウンディング … 続きを読む
Where’s Waldo: Diffusion Features for Personalized Segmentation and Retrieval
要約 パーソナライズされた検索とセグメンテーションは、入力画像と参照インスタンス … 続きを読む
Enhanced Parking Perception by Multi-Task Fisheye Cross-view Transformers
要約 現在の駐車エリア認識アルゴリズムは、主に限られた範囲内の空きスロットを検出 … 続きを読む