Transformers Meet ACT-R: Repeat-Aware and Sequential Listening Session Recommendation

要約

音楽ストリーミング サービスでは、多くの場合、シーケンシャル レコメンダー システムを活用して、過去の一連のリスニング セッションに基づいて、ユーザーに紹介する最適な音楽を予測します。
それにもかかわらず、ほとんどの逐次的な推奨方法は、反復的な動作を無視するか、不十分に説明します。
同じ曲を長期間にわたって繰り返し聴くことは一般的な現象であり、ユーザーのこの曲に対する見方さえも変える可能性があるため、これは音楽の推奨にとって重大な制限です。
この論文では、この制限を克服するセッションレベルの逐次レコメンダーシステムである PISA (Psychology-Informed Session embedding using ACT-R) を紹介します。
PISA は、人間の情報アクセスと記憶のダイナミクスをモデル化した認知アーキテクチャである Anderson の ACT-R (Adaptive Control of Thought-Rational) に触発された注意メカニズムを使用して、リスニング セッションとユーザーの埋め込み表現を学習する Transformer アーキテクチャを採用しています。
このアプローチにより、ユーザーの行動から動的で反復的なパターンを捉えることができ、繰り返される曲か新しい曲かにかかわらず、その後のセッションでユーザーが聴くであろう曲を効果的に予測できるようになります。
私たちは、Last.fm から公開されているリスニング データと、世界的な音楽ストリーミング サービスである Deezer からの独自データの両方を使用して、PISA の経験的関連性を実証し、連続リスニング セッションの推奨における反復モデリングの重要性を確認しています。
この論文とともに、この分野での将来の研究を促進するために独自のデータセットと、将来の利用を容易にするために PISA のソースコードを公開します。

要約(オリジナル)

Music streaming services often leverage sequential recommender systems to predict the best music to showcase to users based on past sequences of listening sessions. Nonetheless, most sequential recommendation methods ignore or insufficiently account for repetitive behaviors. This is a crucial limitation for music recommendation, as repeatedly listening to the same song over time is a common phenomenon that can even change the way users perceive this song. In this paper, we introduce PISA (Psychology-Informed Session embedding using ACT-R), a session-level sequential recommender system that overcomes this limitation. PISA employs a Transformer architecture learning embedding representations of listening sessions and users using attention mechanisms inspired by Anderson’s ACT-R (Adaptive Control of Thought-Rational), a cognitive architecture modeling human information access and memory dynamics. This approach enables us to capture dynamic and repetitive patterns from user behaviors, allowing us to effectively predict the songs they will listen to in subsequent sessions, whether they are repeated or new ones. We demonstrate the empirical relevance of PISA using both publicly available listening data from Last.fm and proprietary data from Deezer, a global music streaming service, confirming the critical importance of repetition modeling for sequential listening session recommendation. Along with this paper, we publicly release our proprietary dataset to foster future research in this field, as well as the source code of PISA to facilitate its future use.

arxiv情報

著者 Viet-Anh Tran,Guillaume Salha-Galvan,Bruno Sguerra,Romain Hennequin
発行日 2024-08-29 14:44:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.IR, cs.LG パーマリンク