Between the AI and Me: Analysing Listeners’ Perspectives on AI- and Human-Composed Progressive Metal Music

要約

生成 AI モデルは最近開花し、芸術や音楽の伝統に大きな影響を与えています。
したがって、人間がこれらのモデルとどのように相互作用し、どのようにみなしているかを調査する研究は非常に重要です。
リスニングとリフレクションの研究を通じて、ロック音楽を対照グループとして使用し、象徴的な形式で AI と人間が生成したプログレッシブ メタルについての参加者の視点を探ります。
AI によって生成されたサンプルは、Transformer ベースのモデルである ProgGP によって生成されました。
私たちは、生成タイプ (人間 vs AI)、ジャンル (プログレッシブ メタル vs ロック)、およびキュレーション プロセス (ランダム vs 厳選) の効果を評価するための混合手法アプローチを提案します。
これは、ジャンルの適合性、好み、創造性、一貫性、プレイアビリティ、人間らしさ、再現性に関する定量的なフィードバックと、リスナーの体験についての洞察を提供する定性的なフィードバックを組み合わせたものです。
合計 32 人のプログレッシブ メタル ファンが調査を完了しました。
私たちの調査結果は、リスナーが AI によって生成されたロックとプログレッシブ メタルを区別できるため、微調整を使用して AI 音楽生成のジャンル固有の特化を達成できることを検証しました。
AI が生成した一部の抜粋は人間の音楽と同様の評価を受けていましたが、リスナーは人間の作曲を好む傾向を示しました。
テーマ分析により、ジャンルと AI と人間の区別に関する重要な特徴が特定されました。
最後に、未開拓のジャンルに焦点を当て、MIR 研究内で音楽データの多様性を促進するという私たちの取り組みの倫理的意味について考察します。

要約(オリジナル)

Generative AI models have recently blossomed, significantly impacting artistic and musical traditions. Research investigating how humans interact with and deem these models is therefore crucial. Through a listening and reflection study, we explore participants’ perspectives on AI- vs human-generated progressive metal, in symbolic format, using rock music as a control group. AI-generated examples were produced by ProgGP, a Transformer-based model. We propose a mixed methods approach to assess the effects of generation type (human vs. AI), genre (progressive metal vs. rock), and curation process (random vs. cherry-picked). This combines quantitative feedback on genre congruence, preference, creativity, consistency, playability, humanness, and repeatability, and qualitative feedback to provide insights into listeners’ experiences. A total of 32 progressive metal fans completed the study. Our findings validate the use of fine-tuning to achieve genre-specific specialization in AI music generation, as listeners could distinguish between AI-generated rock and progressive metal. Despite some AI-generated excerpts receiving similar ratings to human music, listeners exhibited a preference for human compositions. Thematic analysis identified key features for genre and AI vs. human distinctions. Finally, we consider the ethical implications of our work in promoting musical data diversity within MIR research by focusing on an under-explored genre.

arxiv情報

著者 Pedro Sarmento,Jackson Loth,Mathieu Barthet
発行日 2024-07-31 14:03:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.HC, cs.SD, eess.AS パーマリンク