-
最近の投稿
- Learning Multimodal Latent Dynamics for Human-Robot Interaction
- Poutine: Vision-Language-Trajectory Pre-Training and Reinforcement Learning Post-Training Enable Robust End-to-End Autonomous Driving
- Gondola: Grounded Vision Language Planning for Generalizable Robotic Manipulation
- Demonstration Sidetracks: Categorizing Systematic Non-Optimality in Human Demonstrations
- Sensor Model Identification via Simultaneous Model Selection and State Variable Determination
-
最近のコメント
表示できるコメントはありません。 cs.AI (39679) cs.CL (30032) cs.CV (45003) cs.HC (3029) cs.LG (44613) cs.RO (23728) cs.SY (3617) eess.IV (5159) eess.SY (3609) stat.ML (5797)
「cs.GR」カテゴリーアーカイブ
Tactile DreamFusion: Exploiting Tactile Sensing for 3D Generation
要約 3D 生成方法は、拡散画像事前分布を活用した視覚的に説得力のある結果を示し … 続きを読む
BimArt: A Unified Approach for the Synthesis of 3D Bimanual Interaction with Articulated Objects
要約 我々は、多関節オブジェクトとの 3D 両手操作を合成するための新しい生成的 … 続きを読む
Birth and Death of a Rose
要約 私たちは、事前にトレーニングされた 2D 基礎モデルから、時間的なオブジェ … 続きを読む
PDP: Physics-Based Character Animation via Diffusion Policy
要約 環境と物理的に相互作用できる、多様でリアルな人間の動きを生成することは、キ … 続きを読む
MetricGold: Leveraging Text-To-Image Latent Diffusion Models for Metric Depth Estimation
要約 単一の画像からメトリック深度を回復することは、コンピューター ビジョンにお … 続きを読む
RMD: A Simple Baseline for More General Human Motion Generation via Training-free Retrieval-Augmented Motion Diffuse
要約 モーション生成は大幅に進歩しましたが、その実用化には依然としてデータセット … 続きを読む
DynMF: Neural Motion Factorization for Real-time Dynamic View Synthesis with 3D Gaussian Splatting
要約 動的シーンとモーションを正確かつ効率的にモデリングすることは、時間的ダイナ … 続きを読む
Negative Token Merging: Image-based Adversarial Feature Guidance
要約 否定的なプロンプトを使用したテキストベースの敵対的誘導は、拡散モデルを望ま … 続きを読む
Sparse Voxels Rasterization: Real-time High-fidelity Radiance Field Rendering
要約 私たちは、ニューラル ネットワークや 3D ガウスを使用せずに、まばらなボ … 続きを読む
QuadricsReg: Large-Scale Point Cloud Registration using Quadric Primitives
要約 大規模な点群登録の領域では、大量のデータを効率的に処理し、視点の大幅な変動 … 続きを読む