cs.IR」カテゴリーアーカイブ

Multimodal Entity Tagging with Multimodal Knowledge Base

要約 マルチモーダル知識ベースとマルチモーダル情報処理に関する研究を強化するため … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.IR | Multimodal Entity Tagging with Multimodal Knowledge Base はコメントを受け付けていません

Deep Hash Distillation for Image Retrieval

要約 ハッシュベースの画像検索システムでは、劣化または変換された入力は通常、元の … 続きを読む

カテゴリー: cs.CV, cs.IR | Deep Hash Distillation for Image Retrieval はコメントを受け付けていません

Docent: A content-based recommendation system to discover contemporary art

要約 レコメンデーションシステムは、音楽、映画、eショッピングなど、さまざまな分 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR, cs.LG | Docent: A content-based recommendation system to discover contemporary art はコメントを受け付けていません

(Un)likelihood Training for Interpretable Embedding

要約 クロスモーダル表現学習は、テキストデータと視覚データの間の意味的ギャップを … 続きを読む

カテゴリー: cs.CV, cs.IR, cs.MM | (Un)likelihood Training for Interpretable Embedding はコメントを受け付けていません

ReLER@ZJU-Alibaba Submission to the Ego4D Natural Language Queries Challenge 2022

要約 本報告では、CVPR 2022のEgo4D Natural Languag … 続きを読む

カテゴリー: cs.CV, cs.IR | ReLER@ZJU-Alibaba Submission to the Ego4D Natural Language Queries Challenge 2022 はコメントを受け付けていません

VocaLiST: An Audio-Visual Synchronisation Model for Lips and Voices

要約 この論文では、人間の顔と声を含むビデオの唇と声の同期の問題に対処します。 … 続きを読む

カテゴリー: cs.CV, cs.IR, cs.SD, eess.AS | VocaLiST: An Audio-Visual Synchronisation Model for Lips and Voices はコメントを受け付けていません

Exploiting Semantic Role Contextualized Video Features for Multi-Instance Text-Video Retrieval EPIC-KITCHENS-100 Multi-Instance Retrieval Challenge 2022

要約 このレポートでは、EPIC-KITCHENS-100マルチインスタンス検索 … 続きを読む

カテゴリー: cs.CV, cs.IR, cs.LG | Exploiting Semantic Role Contextualized Video Features for Multi-Instance Text-Video Retrieval EPIC-KITCHENS-100 Multi-Instance Retrieval Challenge 2022 はコメントを受け付けていません

whu-nercms at trecvid2021:instance search task

要約 論文のTRECVID2021でWHU-NERCMSの実験方法と結果を簡単に … 続きを読む

カテゴリー: cs.CV, cs.IR, cs.MM | whu-nercms at trecvid2021:instance search task はコメントを受け付けていません

Entity-Graph Enhanced Cross-Modal Pretraining for Instance-level Product Retrieval

要約 この研究の目標は、細粒度の製品カテゴリに対して、弱教師ありマルチモーダルイ … 続きを読む

カテゴリー: cs.CV, cs.DB, cs.IR, cs.MM | Entity-Graph Enhanced Cross-Modal Pretraining for Instance-level Product Retrieval はコメントを受け付けていません

Transformer based Urdu Handwritten Text Optical Character Reader

要約 手書き文字の抽出は、情報をデジタル化し、大規模な設定に利用できるようにする … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR, cs.LG | Transformer based Urdu Handwritten Text Optical Character Reader はコメントを受け付けていません