cs.CV」カテゴリーアーカイブ

ReFlow6D: Refraction-Guided Transparent Object 6D Pose Estimation via Intermediate Representation Learning

要約 透明な物体は日常生活のいたるところに存在しており、その認識とロボットによる … 続きを読む

カテゴリー: 68T45, cs.CV, cs.RO, I.4.8 | ReFlow6D: Refraction-Guided Transparent Object 6D Pose Estimation via Intermediate Representation Learning はコメントを受け付けていません

Inclusion 2024 Global Multimedia Deepfake Detection: Towards Multi-dimensional Facial Forgery Detection

要約 このペーパーでは、Inclusion 2024 と同時に開催されたグローバ … 続きを読む

カテゴリー: cs.CV, cs.MM | Inclusion 2024 Global Multimedia Deepfake Detection: Towards Multi-dimensional Facial Forgery Detection はコメントを受け付けていません

Dual-Space Augmented Intrinsic-LoRA for Wind Turbine Segmentation

要約 風力タービンブレード (WTB) 画像の正確なセグメンテーションは、自動損 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Dual-Space Augmented Intrinsic-LoRA for Wind Turbine Segmentation はコメントを受け付けていません

LatentForensics: Towards frugal deepfake detection in the StyleGAN latent space

要約 偽造ビデオの分類はここ数年の課題でした。 ディープフェイク分類器は、ビデオ … 続きを読む

カテゴリー: 68T45, cs.CV, I.2.10 | LatentForensics: Towards frugal deepfake detection in the StyleGAN latent space はコメントを受け付けていません

Sparse Generation: Making Pseudo Labels Sparse for Point Weakly Supervised Object Detection on Low Data Volume

要約 点の弱教師オブジェクト検出のための既存の擬似ラベル生成方法は、データ量が少 … 続きを読む

カテゴリー: cs.CV | Sparse Generation: Making Pseudo Labels Sparse for Point Weakly Supervised Object Detection on Low Data Volume はコメントを受け付けていません

SoftPatch+: Fully Unsupervised Anomaly Classification and Segmentation

要約 主流の教師なし異常検出 (AD) (画像レベルの分類やピクセル レベルのセ … 続きを読む

カテゴリー: cs.CV | SoftPatch+: Fully Unsupervised Anomaly Classification and Segmentation はコメントを受け付けていません

LINK: Adaptive Modality Interaction for Audio-Visual Video Parsing

要約 オーディオビジュアルビデオの解析は、弱いラベルによってビデオを分類すること … 続きを読む

カテゴリー: cs.CV | LINK: Adaptive Modality Interaction for Audio-Visual Video Parsing はコメントを受け付けていません

Attention Is All You Need For Mixture-of-Depths Routing

要約 深層学習の進歩は、ますます多くのパラメーターを使用してモデルをトレーニング … 続きを読む

カテゴリー: cs.CV | Attention Is All You Need For Mixture-of-Depths Routing はコメントを受け付けていません

LiDAR-Camera Fusion for Video Panoptic Segmentation without Video Training

要約 インスタンス セグメンテーションとセマンティック セグメンテーションを組み … 続きを読む

カテゴリー: cs.CV | LiDAR-Camera Fusion for Video Panoptic Segmentation without Video Training はコメントを受け付けていません

Towards Compatible Fine-tuning for Vision-Language Model Updates

要約 これまでのところ、プラグ アンド プレイ モジュールを学習することで、下流 … 続きを読む

カテゴリー: cs.CV, cs.LG | Towards Compatible Fine-tuning for Vision-Language Model Updates はコメントを受け付けていません