cs.CV」カテゴリーアーカイブ

LoTLIP: Improving Language-Image Pre-training for Long Text Understanding

要約 長いテキストを理解することは実際には大きな要求ですが、ほとんどの言語画像事 … 続きを読む

カテゴリー: cs.CV | LoTLIP: Improving Language-Image Pre-training for Long Text Understanding はコメントを受け付けていません

Beyond FVD: Enhanced Evaluation Metrics for Video Generation Quality

要約 Fr\’echet Video Distance (FVD) … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Beyond FVD: Enhanced Evaluation Metrics for Video Generation Quality はコメントを受け付けていません

MIBench: A Comprehensive Benchmark for Model Inversion Attack and Defense

要約 モデル反転 (MI) 攻撃は、ターゲット モデルの出力情報を利用してプライ … 続きを読む

カテゴリー: cs.CR, cs.CV | MIBench: A Comprehensive Benchmark for Model Inversion Attack and Defense はコメントを受け付けていません

3D-free meets 3D priors: Novel View Synthesis from a Single Image with Pretrained Diffusion Guidance

要約 最近の 3D ノベル ビュー合成 (NVS) 手法は、単一オブジェクト中心 … 続きを読む

カテゴリー: cs.CV | 3D-free meets 3D priors: Novel View Synthesis from a Single Image with Pretrained Diffusion Guidance はコメントを受け付けていません

TuneVLSeg: Prompt Tuning Benchmark for Vision-Language Segmentation Models

要約 視覚言語モデル (VLM) は、視覚タスクにおいて優れたパフォーマンスを示 … 続きを読む

カテゴリー: cs.CL, cs.CV | TuneVLSeg: Prompt Tuning Benchmark for Vision-Language Segmentation Models はコメントを受け付けていません

Control-oriented Clustering of Visual Latent Representation

要約 私たちは、動作のクローン作成から学習した画像ベースの制御パイプラインにおけ … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Control-oriented Clustering of Visual Latent Representation はコメントを受け付けていません

KISS-Matcher: Fast and Robust Point Cloud Registration Revisited

要約 グローバル点群登録システムはあらゆる面で大幅に進歩しましたが、多くの研究は … 続きを読む

カテゴリー: cs.CV, cs.RO | KISS-Matcher: Fast and Robust Point Cloud Registration Revisited はコメントを受け付けていません

Mode-GS: Monocular Depth Guided Anchored 3D Gaussian Splatting for Robust Ground-View Scene Rendering

要約 地上ロボットの軌道データセット用の新しいビュー レンダリング アルゴリズム … 続きを読む

カテゴリー: cs.CV, cs.RO | Mode-GS: Monocular Depth Guided Anchored 3D Gaussian Splatting for Robust Ground-View Scene Rendering はコメントを受け付けていません

Next Best Sense: Guiding Vision and Touch with FisherRF for 3D Gaussian Splatting

要約 3D ガウス スプラッティング (3DGS) を使用したロボット マニピュ … 続きを読む

カテゴリー: cs.CV, cs.RO | Next Best Sense: Guiding Vision and Touch with FisherRF for 3D Gaussian Splatting はコメントを受け付けていません

SplatSim: Zero-Shot Sim2Real Transfer of RGB Manipulation Policies Using Gaussian Splatting

要約 Sim2Real の転送、特に RGB 画像に依存する操作ポリシーの場合、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | SplatSim: Zero-Shot Sim2Real Transfer of RGB Manipulation Policies Using Gaussian Splatting はコメントを受け付けていません