-
最近の投稿
- Agent-Based Emulation for Deploying Robot Swarm Behaviors
- Automated Planning Domain Inference for Task and Motion Planning
- Tactile Displays Driven by Projected Light
- Caging in Time: A Framework for Robust Object Manipulation under Uncertainties and Limited Robot Perception
- Implicit Contact Diffuser: Sequential Contact Reasoning with Latent Point Cloud Diffusion
-
最近のコメント
表示できるコメントはありません。 cs.AI (28464) cs.CL (21516) cs.CR (2224) cs.CV (35088) cs.LG (33220) cs.RO (16420) cs.SY (2528) eess.IV (4274) eess.SY (2522) stat.ML (4457)
「cs.IR」カテゴリーアーカイブ
Multimodal Entity Tagging with Multimodal Knowledge Base
要約 マルチモーダル知識ベースとマルチモーダル情報処理に関する研究を強化するため … 続きを読む
Deep Hash Distillation for Image Retrieval
要約 ハッシュベースの画像検索システムでは、劣化または変換された入力は通常、元の … 続きを読む
Docent: A content-based recommendation system to discover contemporary art
要約 レコメンデーションシステムは、音楽、映画、eショッピングなど、さまざまな分 … 続きを読む
(Un)likelihood Training for Interpretable Embedding
要約 クロスモーダル表現学習は、テキストデータと視覚データの間の意味的ギャップを … 続きを読む
ReLER@ZJU-Alibaba Submission to the Ego4D Natural Language Queries Challenge 2022
要約 本報告では、CVPR 2022のEgo4D Natural Languag … 続きを読む
VocaLiST: An Audio-Visual Synchronisation Model for Lips and Voices
要約 この論文では、人間の顔と声を含むビデオの唇と声の同期の問題に対処します。 … 続きを読む
Exploiting Semantic Role Contextualized Video Features for Multi-Instance Text-Video Retrieval EPIC-KITCHENS-100 Multi-Instance Retrieval Challenge 2022
要約 このレポートでは、EPIC-KITCHENS-100マルチインスタンス検索 … 続きを読む
whu-nercms at trecvid2021:instance search task
要約 論文のTRECVID2021でWHU-NERCMSの実験方法と結果を簡単に … 続きを読む
Entity-Graph Enhanced Cross-Modal Pretraining for Instance-level Product Retrieval
要約 この研究の目標は、細粒度の製品カテゴリに対して、弱教師ありマルチモーダルイ … 続きを読む