cs.CV」カテゴリーアーカイブ

Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models

要約 自律運転における共変量シフト問題に対処するために、潜在空間生成世界モデルの … 続きを読む

カテゴリー: (Primary), 68T45, cs.CV, cs.LG, cs.RO, cs.SY, eess.SY, I.2.10 | Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models はコメントを受け付けていません

GSFeatLoc: Visual Localization Using Feature Correspondence on 3D Gaussian Splatting

要約 このホワイトペーパーでは、事前計算された3Dガウススプラッティング(3DG … 続きを読む

カテゴリー: cs.CV, cs.RO | GSFeatLoc: Visual Localization Using Feature Correspondence on 3D Gaussian Splatting はコメントを受け付けていません

RobMOT: Robust 3D Multi-Object Tracking by Observational Noise and State Estimation Drift Mitigation on LiDAR PointCloud

要約 このペーパーでは、特に正当な軌跡を特定し、カルマンフィルターの状態推定ドリ … 続きを読む

カテゴリー: cs.CV, cs.RO | RobMOT: Robust 3D Multi-Object Tracking by Observational Noise and State Estimation Drift Mitigation on LiDAR PointCloud はコメントを受け付けていません

GLOVER: Generalizable Open-Vocabulary Affordance Reasoning for Task-Oriented Grasping

要約 人間の仕様に基づいた任意のオブジェクトの手頃な価格の(すなわち、把持可能な … 続きを読む

カテゴリー: cs.CV, cs.RO | GLOVER: Generalizable Open-Vocabulary Affordance Reasoning for Task-Oriented Grasping はコメントを受け付けていません

All Languages Matter: Evaluating LMMs on Culturally Diverse 100 Languages

要約 既存の大規模なマルチモーダルモデル(LMM)は、一般に、いくつかの地域と言 … 続きを読む

カテゴリー: cs.CL, cs.CV | All Languages Matter: Evaluating LMMs on Culturally Diverse 100 Languages はコメントを受け付けていません

T2VPhysBench: A First-Principles Benchmark for Physical Consistency in Text-to-Video Generation

要約 テキストからビデオへの生成モデルは、近年大きな進歩を遂げ、審美的な魅力と正 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | T2VPhysBench: A First-Principles Benchmark for Physical Consistency in Text-to-Video Generation はコメントを受け付けていません

AnyStory: Towards Unified Single and Multiple Subject Personalization in Text-to-Image Generation

要約 最近、大規模な生成モデルは、未解決のテキストからイメージまでの生成機能を実 … 続きを読む

カテゴリー: cs.CV | AnyStory: Towards Unified Single and Multiple Subject Personalization in Text-to-Image Generation はコメントを受け付けていません

Latte: Latent Diffusion Transformer for Video Generation

要約 ビデオ生成のための新しい潜在拡散トランスであるラテを提案します。 Latt … 続きを読む

カテゴリー: cs.CV | Latte: Latent Diffusion Transformer for Video Generation はコメントを受け付けていません

Real-Time Animatable 2DGS-Avatars with Detail Enhancement from Monocular Videos

要約 単眼ビデオからの高品質でアニメーション可能な3Dヒトアバター再建は、複雑な … 続きを読む

カテゴリー: cs.CV | Real-Time Animatable 2DGS-Avatars with Detail Enhancement from Monocular Videos はコメントを受け付けていません

Leveraging Pretrained Diffusion Models for Zero-Shot Part Assembly

要約 3Dパーツアセンブリは、部分的な関係を理解し​​、6-DOFポーズを予測し … 続きを読む

カテゴリー: cs.CV | Leveraging Pretrained Diffusion Models for Zero-Shot Part Assembly はコメントを受け付けていません