「cs.MM」カテゴリーアーカイブ

A Plug-and-Play Defensive Perturbation for Copyright Protection of DNN-based Applications

投稿日: 2023年4月24日作成者: jarxiv

要約タイトル：AIアプリケーションの著作権保護のためのプラグアンドプレイ防御的 … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Rethinking Benchmarks for Cross-modal Image-text Retrieval

投稿日: 2023年4月24日作成者: jarxiv

要約タイトル：Cross-modal Image-text Retrieval … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

FindVehicle and VehicleFinder: A NER dataset for natural language-based vehicle retrieval and a keyword-based cross-modal vehicle retrieval system

投稿日: 2023年4月24日作成者: jarxiv

要約タイトル：自然言語に基づく車両検索のためのNERデータセットとキーワードベ … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Learning CLIP Guided Visual-Text Fusion Transformer for Video-based Pedestrian Attribute Recognition

投稿日: 2023年4月21日作成者: jarxiv

要約タイトル：ビデオをベースとした歩行属性認識のためのCLIPガイドの視覚-テ … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Promptify: Text-to-Image Generation through Interactive Prompt Exploration with Large Language Models

投稿日: 2023年4月20日作成者: jarxiv

要約タイトル：Promptify：大規模言語モデルを用いたインタラクティブなプ … 続きを読む →

カテゴリー: cs.AI, cs.HC, cs.MM | コメントを受け付けていません

SP-BatikGAN: An Efficient Generative Adversarial Network for Symmetric Pattern Generation

投稿日: 2023年4月20日作成者: jarxiv

要約タイトル: SP-BatikGAN: 対称的なパターン生成のための効率的な … 続きを読む →

カテゴリー: cs.CV, cs.MM, eess.IV | コメントを受け付けていません

SLIC: Self-Conditioned Adaptive Transform with Large-Scale Receptive Fields for Learned Image Compression

投稿日: 2023年4月20日作成者: jarxiv

要約タイトル：自己条件付き適応変換と大規模受容野を持つ学習済み画像圧縮のSLI … 続きを読む →

カテゴリー: cs.CV, cs.MM, eess.IV | コメントを受け付けていません

MMANet: Margin-aware Distillation and Modality-aware Regularization for Incomplete Multimodal Learning

投稿日: 2023年4月18日作成者: jarxiv

要約タイトル：MMANet：不完全なマルチモーダル学習のためのマージン・アウェ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

FSVVD: A Dataset of Full Scene Volumetric Video

投稿日: 2023年4月18日作成者: jarxiv

要約【タイトル】FSVVD：フルシーンボリューメトリックビデオのデータセット … 続きを読む →

カテゴリー: cs.CV, cs.MM, eess.IV | コメントを受け付けていません

VALOR: Vision-Audio-Language Omni-Perception Pretraining Model and Dataset

投稿日: 2023年4月18日作成者: jarxiv

要約タイトル：ビジョン・オーディオ・ランゲージ・オムニパーセプションの事前学習 … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG, cs.MM, eess.AS | コメントを受け付けていません

「cs.MM」カテゴリーアーカイブ

A Plug-and-Play Defensive Perturbation for Copyright Protection of DNN-based Applications

Rethinking Benchmarks for Cross-modal Image-text Retrieval

FindVehicle and VehicleFinder: A NER dataset for natural language-based vehicle retrieval and a keyword-based cross-modal vehicle retrieval system

Learning CLIP Guided Visual-Text Fusion Transformer for Video-based Pedestrian Attribute Recognition

Promptify: Text-to-Image Generation through Interactive Prompt Exploration with Large Language Models

SP-BatikGAN: An Efficient Generative Adversarial Network for Symmetric Pattern Generation

SLIC: Self-Conditioned Adaptive Transform with Large-Scale Receptive Fields for Learned Image Compression

MMANet: Margin-aware Distillation and Modality-aware Regularization for Incomplete Multimodal Learning

FSVVD: A Dataset of Full Scene Volumetric Video

VALOR: Vision-Audio-Language Omni-Perception Pretraining Model and Dataset

最近の投稿

最近のコメント

アーカイブ

カテゴリー