「cs.CV」カテゴリーアーカイブ

ReFlow6D: Refraction-Guided Transparent Object 6D Pose Estimation via Intermediate Representation Learning

投稿日: 2024年12月31日作成者: jarxiv

要約透明な物体は日常生活のいたるところに存在しており、その認識とロボットによる … 続きを読む →

カテゴリー: 68T45, cs.CV, cs.RO, I.4.8 | コメントを受け付けていません

Inclusion 2024 Global Multimedia Deepfake Detection: Towards Multi-dimensional Facial Forgery Detection

投稿日: 2024年12月31日作成者: jarxiv

要約このペーパーでは、Inclusion 2024 と同時に開催されたグローバ … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Dual-Space Augmented Intrinsic-LoRA for Wind Turbine Segmentation

投稿日: 2024年12月31日作成者: jarxiv

要約風力タービンブレード (WTB) 画像の正確なセグメンテーションは、自動損 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

LatentForensics: Towards frugal deepfake detection in the StyleGAN latent space

投稿日: 2024年12月31日作成者: jarxiv

要約偽造ビデオの分類はここ数年の課題でした。ディープフェイク分類器は、ビデオ … 続きを読む →

カテゴリー: 68T45, cs.CV, I.2.10 | コメントを受け付けていません

Sparse Generation: Making Pseudo Labels Sparse for Point Weakly Supervised Object Detection on Low Data Volume

投稿日: 2024年12月31日作成者: jarxiv

要約点の弱教師オブジェクト検出のための既存の擬似ラベル生成方法は、データ量が少 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

SoftPatch+: Fully Unsupervised Anomaly Classification and Segmentation

投稿日: 2024年12月31日作成者: jarxiv

要約主流の教師なし異常検出 (AD) (画像レベルの分類やピクセルレベルのセ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

LINK: Adaptive Modality Interaction for Audio-Visual Video Parsing

投稿日: 2024年12月31日作成者: jarxiv

要約オーディオビジュアルビデオの解析は、弱いラベルによってビデオを分類すること … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Attention Is All You Need For Mixture-of-Depths Routing

投稿日: 2024年12月31日作成者: jarxiv

要約深層学習の進歩は、ますます多くのパラメーターを使用してモデルをトレーニング … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

LiDAR-Camera Fusion for Video Panoptic Segmentation without Video Training

投稿日: 2024年12月31日作成者: jarxiv

要約インスタンスセグメンテーションとセマンティックセグメンテーションを組み … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Towards Compatible Fine-tuning for Vision-Language Model Updates

投稿日: 2024年12月31日作成者: jarxiv

要約これまでのところ、プラグアンドプレイモジュールを学習することで、下流 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

ReFlow6D: Refraction-Guided Transparent Object 6D Pose Estimation via Intermediate Representation Learning

Inclusion 2024 Global Multimedia Deepfake Detection: Towards Multi-dimensional Facial Forgery Detection

Dual-Space Augmented Intrinsic-LoRA for Wind Turbine Segmentation

LatentForensics: Towards frugal deepfake detection in the StyleGAN latent space

Sparse Generation: Making Pseudo Labels Sparse for Point Weakly Supervised Object Detection on Low Data Volume

SoftPatch+: Fully Unsupervised Anomaly Classification and Segmentation

LINK: Adaptive Modality Interaction for Audio-Visual Video Parsing

Attention Is All You Need For Mixture-of-Depths Routing

LiDAR-Camera Fusion for Video Panoptic Segmentation without Video Training

Towards Compatible Fine-tuning for Vision-Language Model Updates

最近の投稿

最近のコメント

アーカイブ

カテゴリー