「cs.CV」カテゴリーアーカイブ

Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models

投稿日: 2025年5月2日作成者: jarxiv

要約自律運転における共変量シフト問題に対処するために、潜在空間生成世界モデルの … 続きを読む →

カテゴリー: (Primary), 68T45, cs.CV, cs.LG, cs.RO, cs.SY, eess.SY, I.2.10 | コメントを受け付けていません

GSFeatLoc: Visual Localization Using Feature Correspondence on 3D Gaussian Splatting

投稿日: 2025年5月2日作成者: jarxiv

要約このホワイトペーパーでは、事前計算された3Dガウススプラッティング（3DG … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

RobMOT: Robust 3D Multi-Object Tracking by Observational Noise and State Estimation Drift Mitigation on LiDAR PointCloud

投稿日: 2025年5月2日作成者: jarxiv

要約このペーパーでは、特に正当な軌跡を特定し、カルマンフィルターの状態推定ドリ … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

GLOVER: Generalizable Open-Vocabulary Affordance Reasoning for Task-Oriented Grasping

投稿日: 2025年5月2日作成者: jarxiv

要約人間の仕様に基づいた任意のオブジェクトの手頃な価格の（すなわち、把持可能な … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

All Languages Matter: Evaluating LMMs on Culturally Diverse 100 Languages

投稿日: 2025年5月2日作成者: jarxiv

要約既存の大規模なマルチモーダルモデル（LMM）は、一般に、いくつかの地域と言 … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

T2VPhysBench: A First-Principles Benchmark for Physical Consistency in Text-to-Video Generation

投稿日: 2025年5月2日作成者: jarxiv

要約テキストからビデオへの生成モデルは、近年大きな進歩を遂げ、審美的な魅力と正 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

AnyStory: Towards Unified Single and Multiple Subject Personalization in Text-to-Image Generation

投稿日: 2025年5月2日作成者: jarxiv

要約最近、大規模な生成モデルは、未解決のテキストからイメージまでの生成機能を実 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Latte: Latent Diffusion Transformer for Video Generation

投稿日: 2025年5月2日作成者: jarxiv

要約ビデオ生成のための新しい潜在拡散トランスであるラテを提案します。 Latt … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Real-Time Animatable 2DGS-Avatars with Detail Enhancement from Monocular Videos

投稿日: 2025年5月2日作成者: jarxiv

要約単眼ビデオからの高品質でアニメーション可能な3Dヒトアバター再建は、複雑な … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Leveraging Pretrained Diffusion Models for Zero-Shot Part Assembly

投稿日: 2025年5月2日作成者: jarxiv

要約 3Dパーツアセンブリは、部分的な関係を理解し、6-DOFポーズを予測し … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models

GSFeatLoc: Visual Localization Using Feature Correspondence on 3D Gaussian Splatting

RobMOT: Robust 3D Multi-Object Tracking by Observational Noise and State Estimation Drift Mitigation on LiDAR PointCloud

GLOVER: Generalizable Open-Vocabulary Affordance Reasoning for Task-Oriented Grasping

All Languages Matter: Evaluating LMMs on Culturally Diverse 100 Languages

T2VPhysBench: A First-Principles Benchmark for Physical Consistency in Text-to-Video Generation

AnyStory: Towards Unified Single and Multiple Subject Personalization in Text-to-Image Generation

Latte: Latent Diffusion Transformer for Video Generation

Real-Time Animatable 2DGS-Avatars with Detail Enhancement from Monocular Videos

Leveraging Pretrained Diffusion Models for Zero-Shot Part Assembly

最近の投稿

最近のコメント

アーカイブ

カテゴリー