月別アーカイブ: 2024年4月

Bi-LORA: A Vision-Language Approach for Synthetic Image Detection

要約 敵対的生成ネットワーク (GAN) や拡散モデル (DM) などの深層画像 … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.LG | Bi-LORA: A Vision-Language Approach for Synthetic Image Detection はコメントを受け付けていません

Deep Multi-Threshold Spiking-UNet for Image Processing

要約 シンプルかつ効率的なアーキテクチャで知られる U-Net は、画像処理タス … 続きを読む

カテゴリー: cs.CV, cs.NE, eess.IV | Deep Multi-Threshold Spiking-UNet for Image Processing はコメントを受け付けていません

CAM-Based Methods Can See through Walls

要約 CAM ベースの方法は、画像分類モデルの決定を説明する顕著性マップを生成す … 続きを読む

カテゴリー: cs.CV, cs.LG | CAM-Based Methods Can See through Walls はコメントを受け付けていません

PatchCURE: Improving Certifiable Robustness, Model Utility, and Computation Efficiency of Adversarial Patch Defenses

要約 敵対的なパッチ攻撃に対する最先端の防御は、モデルの有用性をわずかに低下させ … 続きを読む

カテゴリー: cs.CR, cs.CV | PatchCURE: Improving Certifiable Robustness, Model Utility, and Computation Efficiency of Adversarial Patch Defenses はコメントを受け付けていません

Dual-Activated Lightweight Attention ResNet50 for Automatic Histopathology Breast Cancer Image Classification

要約 病理組織画像における乳がんの自動分類は、正確な診断と治療計画を立てるために … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Dual-Activated Lightweight Attention ResNet50 for Automatic Histopathology Breast Cancer Image Classification はコメントを受け付けていません

Joint-Task Regularization for Partially Labeled Multi-Task Learning

要約 機械学習の分野ではマルチタスク学習の人気が高まっていますが、その実用性は、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Joint-Task Regularization for Partially Labeled Multi-Task Learning はコメントを受け付けていません

Fashion Style Editing with Generative Human Prior

要約 画像編集は、多数のアプリケーションに広範囲に影響を与えるため、研究コミュニ … 続きを読む

カテゴリー: cs.CV | Fashion Style Editing with Generative Human Prior はコメントを受け付けていません

Cooperative Students: Navigating Unsupervised Domain Adaptation in Nighttime Object Detection

要約 教師なしドメイン適応 (UDA) は、明るい条件下での物体検出において大幅 … 続きを読む

カテゴリー: cs.CV | Cooperative Students: Navigating Unsupervised Domain Adaptation in Nighttime Object Detection はコメントを受け付けていません

VA3: Virtually Assured Amplification Attack on Probabilistic Copyright Protection for Text-to-Image Generative Models

要約 テキストから画像への生成モデルの使用が急増しているため、著作権を侵害するコ … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.CV, cs.MM | VA3: Virtually Assured Amplification Attack on Probabilistic Copyright Protection for Text-to-Image Generative Models はコメントを受け付けていません

DELAN: Dual-Level Alignment for Vision-and-Language Navigation by Cross-Modal Contrastive Learning

要約 視覚と言語のナビゲーション (VLN) では、エージェントが自然言語の指示 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | DELAN: Dual-Level Alignment for Vision-and-Language Navigation by Cross-Modal Contrastive Learning はコメントを受け付けていません