-
最近の投稿
- KISS-Matcher: Fast and Robust Point Cloud Registration Revisited
- Unpacking Failure Modes of Generative Policies: Runtime Monitoring of Consistency and Progress
- Mode-GS: Monocular Depth Guided Anchored 3D Gaussian Splatting for Robust Ground-View Scene Rendering
- A Universal Formulation for Path-Parametric Planning and Control
- Next Best Sense: Guiding Vision and Touch with FisherRF for 3D Gaussian Splatting
-
最近のコメント
表示できるコメントはありません。 cs.AI (27775) cs.CL (20990) cs.CR (2176) cs.CV (34489) cs.LG (32518) cs.RO (15916) cs.SY (2472) eess.IV (4231) eess.SY (2466) stat.ML (4356)
「cs.CV」カテゴリーアーカイブ
InterNet: Unsupervised Cross-modal Homography Estimation Based on Interleaved Modality Transfer and Self-supervised Homography Prediction
要約 我々は、インターリーブモダリティ転送と自己教師付きホモグラフィー予測に基づ … 続きを読む
PhoCoLens: Photorealistic and Consistent Reconstruction in Lensless Imaging
要約 レンズレスカメラは、従来のレンズベースのシステムと比較して、サイズ、重量、 … 続きを読む
Disentangled Clothed Avatar Generation from Text Descriptions
要約 本稿では、人体と衣服を別々に生成し、生成されたアバター上で高品質なアニメー … 続きを読む
Valeo4Cast: A Modular Approach to End-to-End Forecasting
要約 動き予測は、歩行者、車両、信号機などの周囲のエージェントの将来の軌道を予測 … 続きを読む
Synthesizing Environment-Specific People in Photographs
要約 我々は、入力写真に描かれたシーンに意味的に適切な服を着た人物のフォトリアリ … 続きを読む
Transferring disentangled representations: bridging the gap between synthetic and real images
要約 データ生成メカニズムの基本構造を分離する、意味のある効率的な表現を開発する … 続きを読む
ReliOcc: Towards Reliable Semantic Occupancy Prediction via Uncertainty Learning
要約 視覚中心のセマンティック占有予測は自動運転において重要な役割を果たしており … 続きを読む
Exploring Event-based Human Pose Estimation with 3D Event Representations
要約 人間の姿勢推定は、コンピューター ビジョンにおける基本的かつ魅力的なタスク … 続きを読む
EMOVA: Empowering Language Models to See, Hear and Speak with Vivid Emotions
要約 GPT-4o は、多様な感情やトーンの音声会話を可能にするオムニモーダル … 続きを読む