cs.MM」カテゴリーアーカイブ

TOT: Topology-Aware Optimal Transport For Multimodal Hate Detection

要約 タイトル:多様な憎悪検知のためのトポロジー認識最適輸送 要約: &#821 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.MM | TOT: Topology-Aware Optimal Transport For Multimodal Hate Detection はコメントを受け付けていません

Robust and Efficient Memory Network for Video Object Segmentation

要約 タイトル:ビデオオブジェクトセグメンテーションのための堅牢かつ効率的なメモ … 続きを読む

カテゴリー: cs.CV, cs.MM | Robust and Efficient Memory Network for Video Object Segmentation はコメントを受け付けていません

MMC: Multi-Modal Colorization of Images using Textual Descriptions

要約 タイトル:テキスト記述を用いたマルチモーダル画像着色(MMC: Multi … 続きを読む

カテゴリー: cs.CV, cs.MM | MMC: Multi-Modal Colorization of Images using Textual Descriptions はコメントを受け付けていません

GRIG: Few-Shot Generative Residual Image Inpainting

要約 タイトル:GRIG: Few-Shot Generative Residu … 続きを読む

カテゴリー: cs.CV, cs.MM, I.4.4 | GRIG: Few-Shot Generative Residual Image Inpainting はコメントを受け付けていません

A Plug-and-Play Defensive Perturbation for Copyright Protection of DNN-based Applications

要約 タイトル:AIアプリケーションの著作権保護のためのプラグアンドプレイ防御的 … 続きを読む

カテゴリー: cs.CV, cs.MM | A Plug-and-Play Defensive Perturbation for Copyright Protection of DNN-based Applications はコメントを受け付けていません

Rethinking Benchmarks for Cross-modal Image-text Retrieval

要約 タイトル:Cross-modal Image-text Retrieval … 続きを読む

カテゴリー: cs.CV, cs.MM | Rethinking Benchmarks for Cross-modal Image-text Retrieval はコメントを受け付けていません

FindVehicle and VehicleFinder: A NER dataset for natural language-based vehicle retrieval and a keyword-based cross-modal vehicle retrieval system

要約 タイトル:自然言語に基づく車両検索のためのNERデータセットとキーワードベ … 続きを読む

カテゴリー: cs.CV, cs.MM | FindVehicle and VehicleFinder: A NER dataset for natural language-based vehicle retrieval and a keyword-based cross-modal vehicle retrieval system はコメントを受け付けていません

Learning CLIP Guided Visual-Text Fusion Transformer for Video-based Pedestrian Attribute Recognition

要約 タイトル:ビデオをベースとした歩行属性認識のためのCLIPガイドの視覚-テ … 続きを読む

カテゴリー: cs.CV, cs.MM | Learning CLIP Guided Visual-Text Fusion Transformer for Video-based Pedestrian Attribute Recognition はコメントを受け付けていません

Promptify: Text-to-Image Generation through Interactive Prompt Exploration with Large Language Models

要約 タイトル:Promptify:大規模言語モデルを用いたインタラクティブなプ … 続きを読む

カテゴリー: cs.AI, cs.HC, cs.MM | Promptify: Text-to-Image Generation through Interactive Prompt Exploration with Large Language Models はコメントを受け付けていません

SP-BatikGAN: An Efficient Generative Adversarial Network for Symmetric Pattern Generation

要約 タイトル: SP-BatikGAN: 対称的なパターン生成のための効率的な … 続きを読む

カテゴリー: cs.CV, cs.MM, eess.IV | SP-BatikGAN: An Efficient Generative Adversarial Network for Symmetric Pattern Generation はコメントを受け付けていません