AgentCF: Collaborative Learning with Autonomous Language Agents for Recommender Systems

要約

最近、LLM を活用したエージェントを、その優れた意思決定能力に基づいて、信頼できる人間の代理人として採用するケースが出現しています。
ただし、既存の研究は主に人間の対話をシミュレートすることに焦点を当てています。
レコメンダー システムでのアイテムのクリックなどの人間の非言語的動作は、暗黙的にユーザーの好みを示し、ユーザーのモデリングを強化する可能性があるにもかかわらず、深く調査されていません。
主な理由は、言語モデリングと動作モデリングの間のギャップ、およびユーザーと項目の関係に関する LLM の理解の欠如にあります。
この問題に対処するために、エージェントベースの協調フィルタリングを通じてレコメンダー システムでのユーザーとアイテムの対話をシミュレートする AgentCF を提案します。
ユーザーだけでなくアイテムもエージェントとして創造的に考慮し、両方の種類のエージェントを一緒に最適化する協調学習アプローチを開発します。
具体的には、各タイム ステップで、まずユーザー エージェントとアイテム エージェントに自律的に対話するよう促します。
次に、エージェントの決定と現実世界のインタラクション記録の間の相違に基づいて、ユーザーとアイテムのエージェントが誤解を招くシミュレーションを共同で反省し、調整するよう促され、それによって両者の関係をモデル化します。
最適化されたエージェントは、後続の対話でその設定を他のエージェントに伝播することもでき、協調フィルタリングのアイデアを暗黙的にキャプチャします。
全体として、最適化されたエージェントは、ユーザーとアイテム、ユーザーとユーザー、アイテムとアイテム、および集合的なインタラクションを含む、フレームワーク内で多様なインタラクション動作を示します。
結果は、これらのエージェントが現実世界の個人と同様のパーソナライズされた行動を示し、次世代のユーザー行動シミュレーションの開発を促進できることを示しています。

要約(オリジナル)

Recently, there has been an emergence of employing LLM-powered agents as believable human proxies, based on their remarkable decision-making capability. However, existing studies mainly focus on simulating human dialogue. Human non-verbal behaviors, such as item clicking in recommender systems, although implicitly exhibiting user preferences and could enhance the modeling of users, have not been deeply explored. The main reasons lie in the gap between language modeling and behavior modeling, as well as the incomprehension of LLMs about user-item relations. To address this issue, we propose AgentCF for simulating user-item interactions in recommender systems through agent-based collaborative filtering. We creatively consider not only users but also items as agents, and develop a collaborative learning approach that optimizes both kinds of agents together. Specifically, at each time step, we first prompt the user and item agents to interact autonomously. Then, based on the disparities between the agents’ decisions and real-world interaction records, user and item agents are prompted to reflect on and adjust the misleading simulations collaboratively, thereby modeling their two-sided relations. The optimized agents can also propagate their preferences to other agents in subsequent interactions, implicitly capturing the collaborative filtering idea. Overall, the optimized agents exhibit diverse interaction behaviors within our framework, including user-item, user-user, item-item, and collective interactions. The results show that these agents can demonstrate personalized behaviors akin to those of real-world individuals, sparking the development of next-generation user behavior simulation.

arxiv情報

著者 Junjie Zhang,Yupeng Hou,Ruobing Xie,Wenqi Sun,Julian McAuley,Wayne Xin Zhao,Leyu Lin,Ji-Rong Wen
発行日 2023-10-13 16:37:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.IR パーマリンク