注:该网站需要魔法上网
NotaGen:AI驱动的古典音乐创作引擎
NotaGen是由中央音乐学院、北京航空航天大学以及清华大学等顶尖学府共同研发的一款创新型AI音乐生成系统。该模型专精于古典音乐谱曲,采用先进的大型语言模型(LLM)训练方法,为用户提供专业级的乐谱创作体验。
核心功能亮点
精准的古典音乐生成 NotaGen具备强大的风格化创作能力,用户可自由选择音乐时期(如巴洛克、古典、浪漫)、指定作曲家(如巴赫、莫扎特、肖邦)以及乐器组合(如键盘、弦乐四重奏、管弦乐),系统将自动生成符合要求的专业乐谱。
创新的训练体系
深度预训练 系统在超过160万首音乐作品上进行基础训练,深入掌握音乐的基本架构与模式。
精细微调 基于9000余首精选古典音乐作品进行针对性优化,强化对特定音乐风格和作曲家特征的理解。
智能强化学习 采用CLaMP-DPO方法,无需人工标注或预设奖励机制,即可持续提升音乐生成的质量与可控性。
多维度数据呈现
NotaGen运用独特的交错ABC符号表示法(Interleaved ABC Notation),将多声部音符整合为单行显示,并通过[V:]声部指示符进行区分。这种创新表示方式能够高效处理多轨音乐和复杂乐谱结构。
先进架构设计
系统采用Tunesformer架构,包含两个层级的GPT-2解码器:patch级解码器和字符级解码器。通过patch级解码器捕捉时间序列关系,再将隐藏状态传递给字符级解码器,实现自回归式的字符预测。
多样化的创作样本
NotaGen提供丰富的音乐风格样本,涵盖键盘独奏、室内乐、管弦乐、艺术歌曲、合唱以及声乐管弦乐等多种形式。同时,系统也积极探索流行音乐风格的创作可能。
技术细节
数据呈现 采用交错ABC符号表示法,支持多轨音乐和复杂乐谱处理。
系统架构 基于Tunesformer框架,整合patch级和字符级解码器。
训练流程
-
预训练:160万首音乐作品
-
微调:9000首精选古典乐谱,涵盖152位作曲家
-
强化学习:通过CLaMP-DPO方法优化生成质量
性能评估
主观A/B测试 NotaGen在音乐生成质量方面显著优于基线模型,接近人类作曲家水平。
CLaMP-DPO方法 利用对比学习模型CLaMP²的反馈机制,无需人工干预即可持续提升音乐质量。
应用场景
专业创作 为作曲家提供高效的灵感来源,快速生成高质量乐谱。
音乐爱好者 降低音乐创作门槛,支持个性化音乐创作。
音乐教育 作为教学辅助工具,帮助学生深入理解不同音乐风格和时期特征。
资源获取
项目主页:https://electricalexis.github.io/notagen-demo
GitHub仓库:https://github.com/ElectricAlexis/NotaGen
研究论文:https://arxiv.org/pdf/2502.18008
官网:https://electricalexis.github.io/notagen-demo/