cs.IR」カテゴリーアーカイブ

Late multimodal fusion for image and audio music transcription

要約 音楽ソースを構造化されたデジタル形式に変換する音楽のトランスクリプションは … 続きを読む

カテゴリー: cs.CV, cs.IR, cs.MM, cs.SD, eess.AS, I.4 | Late multimodal fusion for image and audio music transcription はコメントを受け付けていません

DnS: Distill-and-Select for Efficient and Accurate Video Indexing and Retrieval

要約 本論文では、大規模データセットにおける高性能かつ計算効率の高いコンテンツベ … 続きを読む

カテゴリー: cs.CV, cs.IR, cs.MM | DnS: Distill-and-Select for Efficient and Accurate Video Indexing and Retrieval はコメントを受け付けていません

Fashion Recommendation Based on Style and Social Events

要約 ファッションのレコメンデーションは、検索された衣服から補完的なアイテムを見 … 続きを読む

カテゴリー: cs.CV, cs.IR | Fashion Recommendation Based on Style and Social Events はコメントを受け付けていません

Multimodal Entity Tagging with Multimodal Knowledge Base

要約 マルチモーダル知識ベースとマルチモーダル情報処理に関する研究を強化するため … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.IR | Multimodal Entity Tagging with Multimodal Knowledge Base はコメントを受け付けていません

Deep Hash Distillation for Image Retrieval

要約 ハッシュベースの画像検索システムでは、劣化または変換された入力は通常、元の … 続きを読む

カテゴリー: cs.CV, cs.IR | Deep Hash Distillation for Image Retrieval はコメントを受け付けていません

Docent: A content-based recommendation system to discover contemporary art

要約 レコメンデーションシステムは、音楽、映画、eショッピングなど、さまざまな分 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR, cs.LG | Docent: A content-based recommendation system to discover contemporary art はコメントを受け付けていません

(Un)likelihood Training for Interpretable Embedding

要約 クロスモーダル表現学習は、テキストデータと視覚データの間の意味的ギャップを … 続きを読む

カテゴリー: cs.CV, cs.IR, cs.MM | (Un)likelihood Training for Interpretable Embedding はコメントを受け付けていません

ReLER@ZJU-Alibaba Submission to the Ego4D Natural Language Queries Challenge 2022

要約 本報告では、CVPR 2022のEgo4D Natural Languag … 続きを読む

カテゴリー: cs.CV, cs.IR | ReLER@ZJU-Alibaba Submission to the Ego4D Natural Language Queries Challenge 2022 はコメントを受け付けていません

VocaLiST: An Audio-Visual Synchronisation Model for Lips and Voices

要約 この論文では、人間の顔と声を含むビデオの唇と声の同期の問題に対処します。 … 続きを読む

カテゴリー: cs.CV, cs.IR, cs.SD, eess.AS | VocaLiST: An Audio-Visual Synchronisation Model for Lips and Voices はコメントを受け付けていません

Exploiting Semantic Role Contextualized Video Features for Multi-Instance Text-Video Retrieval EPIC-KITCHENS-100 Multi-Instance Retrieval Challenge 2022

要約 このレポートでは、EPIC-KITCHENS-100マルチインスタンス検索 … 続きを読む

カテゴリー: cs.CV, cs.IR, cs.LG | Exploiting Semantic Role Contextualized Video Features for Multi-Instance Text-Video Retrieval EPIC-KITCHENS-100 Multi-Instance Retrieval Challenge 2022 はコメントを受け付けていません