cs.CV」カテゴリーアーカイブ

Computational Trichromacy Reconstruction: Empowering the Color-Vision Deficient to Recognize Colors Using Augmented Reality

要約 私たちは、色覚異常 (CVD) を持つ人々が色の認識/名前付けを支援する支 … 続きを読む

カテゴリー: cs.CV, cs.HC | Computational Trichromacy Reconstruction: Empowering the Color-Vision Deficient to Recognize Colors Using Augmented Reality はコメントを受け付けていません

WaSt-3D: Wasserstein-2 Distance for Scene-to-Scene Stylization on 3D Gaussians

要約 スタイル転送技術は 2D 画像の様式化のために十分に開発されていますが、こ … 続きを読む

カテゴリー: cs.CV | WaSt-3D: Wasserstein-2 Distance for Scene-to-Scene Stylization on 3D Gaussians はコメントを受け付けていません

Resolving Multi-Condition Confusion for Finetuning-Free Personalized Image Generation

要約 パーソナライズされたテキストから画像への生成方法は、参照画像に基づいてカス … 続きを読む

カテゴリー: cs.CV | Resolving Multi-Condition Confusion for Finetuning-Free Personalized Image Generation はコメントを受け付けていません

Neural Light Spheres for Implicit Image Stitching and View Synthesis

要約 パノラマは、キャプチャするのが難しく、携帯電話の画面に表示するのが難しいた … 続きを読む

カテゴリー: cs.CV | Neural Light Spheres for Implicit Image Stitching and View Synthesis はコメントを受け付けていません

CollaMamba: Efficient Collaborative Perception with Cross-Agent Spatial-Temporal State Space Model

要約 相補的な知覚情報を共有することにより、複数のエージェントが協力して知覚する … 続きを読む

カテゴリー: cs.CV, cs.MA | CollaMamba: Efficient Collaborative Perception with Cross-Agent Spatial-Temporal State Space Model はコメントを受け付けていません

Manydepth2: Motion-Aware Self-Supervised Monocular Depth Estimation in Dynamic Scenes

要約 自己監視型単眼奥行き推定の進歩にもかかわらず、静的な世界についての仮定に依 … 続きを読む

カテゴリー: cs.CV | Manydepth2: Motion-Aware Self-Supervised Monocular Depth Estimation in Dynamic Scenes はコメントを受け付けていません

Perturb, Attend, Detect and Localize (PADL): Robust Proactive Image Defense

要約 画像操作の検出と位置特定は、生成モデル (GM) の普及により、研究コミュ … 続きを読む

カテゴリー: cs.CV | Perturb, Attend, Detect and Localize (PADL): Robust Proactive Image Defense はコメントを受け付けていません

Spatial Hierarchy and Temporal Attention Guided Cross Masking for Self-supervised Skeleton-based Action Recognition

要約 自己教師ありスケルトンベースのアクション認識では、効果的なマスキングを通じ … 続きを読む

カテゴリー: cs.CV | Spatial Hierarchy and Temporal Attention Guided Cross Masking for Self-supervised Skeleton-based Action Recognition はコメントを受け付けていません

The Hard Positive Truth about Vision-Language Compositionality

要約 いくつかのベンチマークは、私たちの最良のビジョン言語モデル (CLIP な … 続きを読む

カテゴリー: cs.CL, cs.CV | The Hard Positive Truth about Vision-Language Compositionality はコメントを受け付けていません

Jumping through Local Minima: Quantization in the Loss Landscape of Vision Transformers

要約 量子化スケールとビット幅は、ニューラル ネットワークの量子化方法を検討する … 続きを読む

カテゴリー: cs.CV | Jumping through Local Minima: Quantization in the Loss Landscape of Vision Transformers はコメントを受け付けていません