Multimodal Recommender Systems: A Survey

要約

レコメンダー システム (RS) は、オンライン サービスに不可欠なツールキットです。
これらには、識別子と属性情報に基づいてユーザーの好みをモデル化するためのさまざまな深層学習技術が搭載されています。
短いビデオやニュースなどのマルチメディア サービスの出現により、推奨する際にこれらのコンテンツを理解することが重要になります。
さらに、マルチモーダル機能は、RS のデータの疎性の問題を軽減するのにも役立ちます。
このように、マルチモーダル レコメンダー システム (MRS) は、最近学界と産業界の両方から大きな注目を集めています。
本稿では、主に技術的な観点からMRSモデルを総合的に概観していきます。
まず、MRS の一般的な手順と主要な課題をまとめます。
次に、モダリティ エンコーダ、機能インタラクション、機能強化、モデル最適化の 4 つのカテゴリに従って既存の MRS モデルを紹介します。
さらに、この分野を研究したい人にとって便利なように、データセットとコード リソースもまとめています。
最後に、MRS の将来の有望な方向性についていくつか議論し、この文書を締めくくります。
実装コードなど、調査対象の論文の詳細にアクセスするには、リポジトリをオープンソースにします。

要約(オリジナル)

The recommender system (RS) has been an integral toolkit of online services. They are equipped with various deep learning techniques to model user preference based on identifier and attribute information. With the emergence of multimedia services, such as short videos, news and etc., understanding these contents while recommending becomes critical. Besides, multimodal features are also helpful in alleviating the problem of data sparsity in RS. Thus, Multimodal Recommender System (MRS) has attracted much attention from both academia and industry recently. In this paper, we will give a comprehensive survey of the MRS models, mainly from technical views. First, we conclude the general procedures and major challenges for MRS. Then, we introduce the existing MRS models according to four categories, i.e., Modality Encoder, Feature Interaction, Feature Enhancement and Model Optimization. Besides, to make it convenient for those who want to research this field, we also summarize the dataset and code resources. Finally, we discuss some promising future directions of MRS and conclude this paper. To access more details of the surveyed papers, such as implementation code, we open source a repository.

arxiv情報

著者 Qidong Liu,Jiaxi Hu,Yutian Xiao,Xiangyu Zhao,Jingtong Gao,Wanyu Wang,Qing Li,Jiliang Tang
発行日 2024-09-04 14:00:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.IR パーマリンク