cs.MM」カテゴリーアーカイブ

A Plug-and-Play Defensive Perturbation for Copyright Protection of DNN-based Applications

要約 タイトル:AIアプリケーションの著作権保護のためのプラグアンドプレイ防御的 … 続きを読む

カテゴリー: cs.CV, cs.MM | A Plug-and-Play Defensive Perturbation for Copyright Protection of DNN-based Applications はコメントを受け付けていません

Rethinking Benchmarks for Cross-modal Image-text Retrieval

要約 タイトル:Cross-modal Image-text Retrieval … 続きを読む

カテゴリー: cs.CV, cs.MM | Rethinking Benchmarks for Cross-modal Image-text Retrieval はコメントを受け付けていません

FindVehicle and VehicleFinder: A NER dataset for natural language-based vehicle retrieval and a keyword-based cross-modal vehicle retrieval system

要約 タイトル:自然言語に基づく車両検索のためのNERデータセットとキーワードベ … 続きを読む

カテゴリー: cs.CV, cs.MM | FindVehicle and VehicleFinder: A NER dataset for natural language-based vehicle retrieval and a keyword-based cross-modal vehicle retrieval system はコメントを受け付けていません

Learning CLIP Guided Visual-Text Fusion Transformer for Video-based Pedestrian Attribute Recognition

要約 タイトル:ビデオをベースとした歩行属性認識のためのCLIPガイドの視覚-テ … 続きを読む

カテゴリー: cs.CV, cs.MM | Learning CLIP Guided Visual-Text Fusion Transformer for Video-based Pedestrian Attribute Recognition はコメントを受け付けていません

Promptify: Text-to-Image Generation through Interactive Prompt Exploration with Large Language Models

要約 タイトル:Promptify:大規模言語モデルを用いたインタラクティブなプ … 続きを読む

カテゴリー: cs.AI, cs.HC, cs.MM | Promptify: Text-to-Image Generation through Interactive Prompt Exploration with Large Language Models はコメントを受け付けていません

SP-BatikGAN: An Efficient Generative Adversarial Network for Symmetric Pattern Generation

要約 タイトル: SP-BatikGAN: 対称的なパターン生成のための効率的な … 続きを読む

カテゴリー: cs.CV, cs.MM, eess.IV | SP-BatikGAN: An Efficient Generative Adversarial Network for Symmetric Pattern Generation はコメントを受け付けていません

SLIC: Self-Conditioned Adaptive Transform with Large-Scale Receptive Fields for Learned Image Compression

要約 タイトル:自己条件付き適応変換と大規模受容野を持つ学習済み画像圧縮のSLI … 続きを読む

カテゴリー: cs.CV, cs.MM, eess.IV | SLIC: Self-Conditioned Adaptive Transform with Large-Scale Receptive Fields for Learned Image Compression はコメントを受け付けていません

MMANet: Margin-aware Distillation and Modality-aware Regularization for Incomplete Multimodal Learning

要約 タイトル:MMANet:不完全なマルチモーダル学習のためのマージン・アウェ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | MMANet: Margin-aware Distillation and Modality-aware Regularization for Incomplete Multimodal Learning はコメントを受け付けていません

FSVVD: A Dataset of Full Scene Volumetric Video

要約 【タイトル】FSVVD:フルシーンボリューメトリックビデオのデータセット … 続きを読む

カテゴリー: cs.CV, cs.MM, eess.IV | FSVVD: A Dataset of Full Scene Volumetric Video はコメントを受け付けていません

VALOR: Vision-Audio-Language Omni-Perception Pretraining Model and Dataset

要約 タイトル:ビジョン・オーディオ・ランゲージ・オムニパーセプションの事前学習 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG, cs.MM, eess.AS | VALOR: Vision-Audio-Language Omni-Perception Pretraining Model and Dataset はコメントを受け付けていません