Multimodal Recommender Systems: A Survey


レコメンダー システム (RS) は、オンライン サービスに不可欠なツールキットです。
短いビデオやニュースなどのマルチメディア サービスの出現により、推奨する際にこれらのコンテンツを理解することが重要になります。
さらに、マルチモーダル機能は、RS のデータの疎性の問題を軽減するのにも役立ちます。
このように、マルチモーダル レコメンダー システム (MRS) は、最近学界と産業界の両方から大きな注目を集めています。
まず、MRS の一般的な手順と主要な課題をまとめます。
次に、モダリティ エンコーダ、機能インタラクション、機能強化、モデル最適化の 4 つのカテゴリに従って既存の MRS モデルを紹介します。
さらに、この分野を研究したい人にとって便利なように、データセットとコード リソースもまとめています。
最後に、MRS の将来の有望な方向性についていくつか議論し、この文書を締めくくります。


The recommender system (RS) has been an integral toolkit of online services. They are equipped with various deep learning techniques to model user preference based on identifier and attribute information. With the emergence of multimedia services, such as short videos, news and etc., understanding these contents while recommending becomes critical. Besides, multimodal features are also helpful in alleviating the problem of data sparsity in RS. Thus, Multimodal Recommender System (MRS) has attracted much attention from both academia and industry recently. In this paper, we will give a comprehensive survey of the MRS models, mainly from technical views. First, we conclude the general procedures and major challenges for MRS. Then, we introduce the existing MRS models according to four categories, i.e., Modality Encoder, Feature Interaction, Feature Enhancement and Model Optimization. Besides, to make it convenient for those who want to research this field, we also summarize the dataset and code resources. Finally, we discuss some promising future directions of MRS and conclude this paper. To access more details of the surveyed papers, such as implementation code, we open source a repository.


著者 Qidong Liu,Jiaxi Hu,Yutian Xiao,Xiangyu Zhao,Jingtong Gao,Wanyu Wang,Qing Li,Jiliang Tang
発行日 2024-09-04 14:00:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.IR パーマリンク