-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models
要約 自律運転における共変量シフト問題に対処するために、潜在空間生成世界モデルの … 続きを読む
GSFeatLoc: Visual Localization Using Feature Correspondence on 3D Gaussian Splatting
要約 このホワイトペーパーでは、事前計算された3Dガウススプラッティング(3DG … 続きを読む
RobMOT: Robust 3D Multi-Object Tracking by Observational Noise and State Estimation Drift Mitigation on LiDAR PointCloud
要約 このペーパーでは、特に正当な軌跡を特定し、カルマンフィルターの状態推定ドリ … 続きを読む
GLOVER: Generalizable Open-Vocabulary Affordance Reasoning for Task-Oriented Grasping
要約 人間の仕様に基づいた任意のオブジェクトの手頃な価格の(すなわち、把持可能な … 続きを読む
All Languages Matter: Evaluating LMMs on Culturally Diverse 100 Languages
要約 既存の大規模なマルチモーダルモデル(LMM)は、一般に、いくつかの地域と言 … 続きを読む
T2VPhysBench: A First-Principles Benchmark for Physical Consistency in Text-to-Video Generation
要約 テキストからビデオへの生成モデルは、近年大きな進歩を遂げ、審美的な魅力と正 … 続きを読む
AnyStory: Towards Unified Single and Multiple Subject Personalization in Text-to-Image Generation
要約 最近、大規模な生成モデルは、未解決のテキストからイメージまでの生成機能を実 … 続きを読む
カテゴリー: cs.CV
AnyStory: Towards Unified Single and Multiple Subject Personalization in Text-to-Image Generation はコメントを受け付けていません
Latte: Latent Diffusion Transformer for Video Generation
要約 ビデオ生成のための新しい潜在拡散トランスであるラテを提案します。 Latt … 続きを読む
カテゴリー: cs.CV
Latte: Latent Diffusion Transformer for Video Generation はコメントを受け付けていません
Real-Time Animatable 2DGS-Avatars with Detail Enhancement from Monocular Videos
要約 単眼ビデオからの高品質でアニメーション可能な3Dヒトアバター再建は、複雑な … 続きを読む
カテゴリー: cs.CV
Real-Time Animatable 2DGS-Avatars with Detail Enhancement from Monocular Videos はコメントを受け付けていません
Leveraging Pretrained Diffusion Models for Zero-Shot Part Assembly
要約 3Dパーツアセンブリは、部分的な関係を理解し、6-DOFポーズを予測し … 続きを読む
カテゴリー: cs.CV
Leveraging Pretrained Diffusion Models for Zero-Shot Part Assembly はコメントを受け付けていません