月別アーカイブ: 2024年4月

V2X-DGW: Domain Generalization for Multi-agent Perception under Adverse Weather Conditions

要約 現在の LiDAR ベースの Vehicle-to-Everything … 続きを読む

カテゴリー: cs.CV | V2X-DGW: Domain Generalization for Multi-agent Perception under Adverse Weather Conditions はコメントを受け付けていません

You Only Sample Once: Taming One-Step Text-To-Image Synthesis by Self-Cooperative Diffusion GANs

要約 YOSO は、迅速かつスケーラブルで忠実度の高いワンステップ画像合成用に設 … 続きを読む

カテゴリー: cs.CV | You Only Sample Once: Taming One-Step Text-To-Image Synthesis by Self-Cooperative Diffusion GANs はコメントを受け付けていません

Rethinking Multi-view Representation Learning via Distilled Disentangling

要約 マルチビュー表現学習の目的は、多様なデータ ソースからビューの一貫性とビュ … 続きを読む

カテゴリー: cs.CV, cs.MM | Rethinking Multi-view Representation Learning via Distilled Disentangling はコメントを受け付けていません

H2RSVLM: Towards Helpful and Honest Remote Sensing Large Vision Language Model

要約 一般的な大規模視覚言語モデル (VLM) は急速に開発されていますが、リモ … 続きを読む

カテゴリー: cs.CV | H2RSVLM: Towards Helpful and Honest Remote Sensing Large Vision Language Model はコメントを受け付けていません

Self-learning Canonical Space for Multi-view 3D Human Pose Estimation

要約 マルチビュー 3D 人間の姿勢推定は、当然ながら単一ビューの推定よりも優れ … 続きを読む

カテゴリー: cs.CV | Self-learning Canonical Space for Multi-view 3D Human Pose Estimation はコメントを受け付けていません

DragVideo: Interactive Drag-style Video Editing

要約 ビデオ生成モデルは、写真のようにリアルなビデオを生成する優れた能力を示して … 続きを読む

カテゴリー: cs.CV, cs.GR | DragVideo: Interactive Drag-style Video Editing はコメントを受け付けていません

MTMMC: A Large-Scale Real-World Multi-Modal Camera Tracking Benchmark

要約 マルチターゲット マルチカメラ追跡は、複数のカメラからのビデオ ストリーム … 続きを読む

カテゴリー: cs.CV | MTMMC: A Large-Scale Real-World Multi-Modal Camera Tracking Benchmark はコメントを受け付けていません

3DInAction: Understanding Human Actions in 3D Point Clouds

要約 我々は、3D点群アクション認識のための新しい方法を提案します。 RGB ビ … 続きを読む

カテゴリー: cs.CV | 3DInAction: Understanding Human Actions in 3D Point Clouds はコメントを受け付けていません

U-VAP: User-specified Visual Appearance Personalization via Decoupled Self Augmentation

要約 コンセプトのパーソナライゼーション手法により、大規模なテキストから画像への … 続きを読む

カテゴリー: cs.CV | U-VAP: User-specified Visual Appearance Personalization via Decoupled Self Augmentation はコメントを受け付けていません

Long-Tailed Anomaly Detection with Learnable Class Names

要約 異常検出 (AD) は、欠陥のある画像を特定し、その欠陥 (存在する場合) … 続きを読む

カテゴリー: cs.CV | Long-Tailed Anomaly Detection with Learnable Class Names はコメントを受け付けていません