-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Chasing Better Deep Image Priors between Over- and Under-parameterization
要約 ディープ ニューラル ネットワーク (DNN) は、さまざまな画像逆問題を … 続きを読む
DiffPano: Scalable and Consistent Text to Panorama Generation with Spherical Epipolar-Aware Diffusion
要約 拡散ベースの手法は、2D 画像や 3D オブジェクトの生成において目覚まし … 続きを読む
GeoSplatting: Towards Geometry Guided Gaussian Splatting for Physically-based Inverse Rendering
要約 3D ガウス スプラッティング (3DGS) 表現を使用して、物理ベースの … 続きを読む
カテゴリー: cs.CV
GeoSplatting: Towards Geometry Guided Gaussian Splatting for Physically-based Inverse Rendering はコメントを受け付けていません
No Pose, No Problem: Surprisingly Simple 3D Gaussian Splats from Sparse Unposed Images
要約 \textit{unposed} のまばらなマルチビュー画像から 3D ガ … 続きを読む
カテゴリー: cs.CV
No Pose, No Problem: Surprisingly Simple 3D Gaussian Splats from Sparse Unposed Images はコメントを受け付けていません
NAVSIM: Data-Driven Non-Reactive Autonomous Vehicle Simulation and Benchmarking
要約 ビジョンに基づいた運転政策のベンチマークは困難です。 一方で、実際のデータ … 続きを読む
DELTA: Dense Efficient Long-range 3D Tracking for any video
要約 単眼ビデオから高密度の 3D モーションを追跡することは、特に長いシーケン … 続きを読む
カテゴリー: cs.CV
DELTA: Dense Efficient Long-range 3D Tracking for any video はコメントを受け付けていません
Learning Video Representations without Natural Videos
要約 この論文では、トレーニングに自然ビデオを組み込むことなく、合成ビデオと自然 … 続きを読む
カテゴリー: cs.CV
Learning Video Representations without Natural Videos はコメントを受け付けていません
ARQ: A Mixed-Precision Quantization Framework for Accurate and Certifiably Robust DNNs
要約 混合精度量子化は、限られたリソースのコンピューティング プラットフォーム上 … 続きを読む
Teaching Embodied Reinforcement Learning Agents: Informativeness and Diversity of Language Use
要約 現実世界のシナリオでは、身体化されたエージェントが人間の言語を活用して学習 … 続きを読む
Enhancing Motion in Text-to-Video Generation with Decomposed Encoding and Conditioning
要約 Text-to-Video (T2V) 生成の進歩にもかかわらず、リアルな … 続きを読む
カテゴリー: cs.CV
Enhancing Motion in Text-to-Video Generation with Decomposed Encoding and Conditioning はコメントを受け付けていません