Predicting User Intents and Musical Attributes from Music Discovery Conversations

要約

意図分類は、入力テキスト クエリからユーザーのニーズを特定するテキスト理解タスクです。
インテント分類はさまざまな分野で広く研究されていますが、音楽分野ではあまり注目されていません。
この論文では、事前トレーニングされた言語モデルに焦点を当てて、音楽発見会話のための意図分類モデルを調査します。
機能的ニーズの予測 (意図分類) だけでなく、音楽的ニーズを分類するためのタスク (音楽属性分類) も組み込みます。
さらに、以前のチャット履歴を入力テキスト内の 1 回のユーザー クエリと連結する方法を提案します。これにより、モデルが全体的な会話のコンテキストをよりよく理解できるようになります。
私たちが提案したモデルは、ユーザーの意図と音楽属性分類の両方で F1 スコアを大幅に向上させ、事前トレーニングされた Llama 3 モデルのゼロショットおよび少数ショットのパフォーマンスを上回りました。

要約(オリジナル)

Intent classification is a text understanding task that identifies user needs from input text queries. While intent classification has been extensively studied in various domains, it has not received much attention in the music domain. In this paper, we investigate intent classification models for music discovery conversation, focusing on pre-trained language models. Rather than only predicting functional needs: intent classification, we also include a task for classifying musical needs: musical attribute classification. Additionally, we propose a method of concatenating previous chat history with just single-turn user queries in the input text, allowing the model to understand the overall conversation context better. Our proposed model significantly improves the F1 score for both user intent and musical attribute classification, and surpasses the zero-shot and few-shot performance of the pretrained Llama 3 model.

arxiv情報

著者 Daeyong Kwon,SeungHeon Doh,Juhan Nam
発行日 2024-11-20 13:24:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS パーマリンク