「68Txx(Primary)14F05」カテゴリーアーカイブ

SaMoye: Zero-shot Singing Voice Conversion Based on Feature Disentanglement and Synthesis

投稿日: 2024年7月12日作成者: jarxiv

要約歌声変換 (SVC) は、元の内容を維持したまま、特定の音楽作品内の歌手の … 続きを読む →

カテゴリー: 68Txx(Primary)14F05, 91Fxx(Secondary), cs.AI, cs.MM, cs.SD, eess.AS, I.2.7 | コメントを受け付けていません

SaMoye: Zero-shot Singing Voice Conversion Based on Feature Disentanglement and Synthesis

投稿日: 2024年7月11日作成者: jarxiv

要約歌声変換 (SVC) は、元の内容を維持したまま、特定の音楽作品内の歌手の … 続きを読む →

カテゴリー: 68Txx(Primary)14F05, 91Fxx(Secondary), cs.AI, cs.MM, cs.SD, eess.AS, I.2.7 | コメントを受け付けていません

MuDiT & MuSiT: Alignment with Colloquial Expression in Description-to-Song Generation

投稿日: 2024年7月4日作成者: jarxiv

要約生成的AIと人間の芸術的プロセスが交錯する中、本研究では、人間中心の自動作 … 続きを読む →

カテゴリー: 68Txx(Primary)14F05, 91Fxx(Secondary), cs.AI, cs.MM, cs.SD, eess.AS, I.2.7 | コメントを受け付けていません

MuChin: A Chinese Colloquial Description Benchmark for Evaluating Language Models in the Field of Music

投稿日: 2024年4月3日作成者: jarxiv

要約急速に進化するマルチモーダル大規模言語モデル (LLM) では、音楽の理解 … 続きを読む →

カテゴリー: 68Txx(Primary)14F05, 91Fxx(Secondary), cs.AI, cs.MM, cs.SD, eess.AS, I.2.7 | コメントを受け付けていません