月別アーカイブ: 2024年5月

SD-NAE: Generating Natural Adversarial Examples with Stable Diffusion

要約 Natural Adversarial Examples (NAE) は、 … 続きを読む

カテゴリー: cs.CV | SD-NAE: Generating Natural Adversarial Examples with Stable Diffusion はコメントを受け付けていません

Farm3D: Learning Articulated 3D Animals by Distilling 2D Diffusion

要約 我々は、事前にトレーニングされた 2D 拡散ベースの画像ジェネレーターから … 続きを読む

カテゴリー: cs.CV | Farm3D: Learning Articulated 3D Animals by Distilling 2D Diffusion はコメントを受け付けていません

ConsistencyDet: A Robust Object Detector with a Denoising Paradigm of Consistency Model

要約 知覚コンピューティングの分野における典型的なタスクであるオブジェクト検出は … 続きを読む

カテゴリー: cs.CV | ConsistencyDet: A Robust Object Detector with a Denoising Paradigm of Consistency Model はコメントを受け付けていません

Promoting AI Equity in Science: Generalized Domain Prompt Learning for Accessible VLM Research

要約 大規模視覚言語モデル (VLM) は、自然視覚タスクにおいて優れたパフォー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, stat.AP | Promoting AI Equity in Science: Generalized Domain Prompt Learning for Accessible VLM Research はコメントを受け付けていません

EndoDAC: Efficient Adapting Foundation Model for Self-Supervised Depth Estimation from Any Endoscopic Camera

要約 深さの推定は、ナビゲーション、表面再構築、拡張現実の視覚化など、内視鏡手術 … 続きを読む

カテゴリー: cs.CV, eess.IV | EndoDAC: Efficient Adapting Foundation Model for Self-Supervised Depth Estimation from Any Endoscopic Camera はコメントを受け付けていません

Achieving Fairness Through Channel Pruning for Dermatological Disease Diagnosis

要約 多くの研究により、深層学習ベースの医療画像分類モデルは、人種、性別、年齢な … 続きを読む

カテゴリー: cs.AI, cs.CV | Achieving Fairness Through Channel Pruning for Dermatological Disease Diagnosis はコメントを受け付けていません

VimTS: A Unified Video and Image Text Spotter for Enhancing the Cross-domain Generalization

要約 画像またはビデオシーケンスからテキスト情報を抽出するタスクであるテキストス … 続きを読む

カテゴリー: cs.AI, cs.CV | VimTS: A Unified Video and Image Text Spotter for Enhancing the Cross-domain Generalization はコメントを受け付けていません

Splat-MOVER: Multi-Stage, Open-Vocabulary Robotic Manipulation via Editable Gaussian Splatting

要約 我々は、オープンボキャブラリーのロボット操作のためのモジュール型ロボットス … 続きを読む

カテゴリー: cs.CV, cs.RO | Splat-MOVER: Multi-Stage, Open-Vocabulary Robotic Manipulation via Editable Gaussian Splatting はコメントを受け付けていません

The impact of Compositionality in Zero-shot Multi-label action recognition for Object-based tasks

要約 ビデオにおけるマルチラベルのアクション認識に対処することは、動的な環境にお … 続きを読む

カテゴリー: cs.CV, cs.RO | The impact of Compositionality in Zero-shot Multi-label action recognition for Object-based tasks はコメントを受け付けていません

View-Centric Multi-Object Tracking with Homographic Matching in Moving UAV

要約 このペーパーでは、無人航空機 (UAV) の移動シナリオにおける複数オブジ … 続きを読む

カテゴリー: cs.CV | View-Centric Multi-Object Tracking with Homographic Matching in Moving UAV はコメントを受け付けていません