阶跃星辰与ACE Studio联合发布了开源音乐大模型ACE-Step(中文名:音跃),标志着音乐创作与生成技术的又一重要突破。ACE-Step是继语音、视频、图片、视觉推理等多模态大模型之后的又一成果,展现了音乐创作与生成的最新进展。
ACE Studio是一家以生成式AI技术为核心的科技公司,其产品ACE Studio是一款Gen-AI为核心的音乐创作工作站产品,用户遍布全球,包括格莱美获奖者和世界顶级的工作室。ACE-Step大模型参数量为3.5B,具备快速高质量生成、强可控性和易于拓展等特点,支持多种语言的歌曲生成,涵盖中、英、日、韩、西班牙、俄语等19种语言。
ACE-Step的创新架构与训练策略提升了旋律的流畅性和歌词的契合度,使生成的音乐在旋律、结构上更完整、更具情感表达力。作为通用性强的音乐基础模型,ACE-Step支持包括LoRA和ControlNet在内的多种微调方式,可灵活适配音频编辑、人声合成、伴奏生成、声线克隆、风格迁移等多种下游任务,极大降低了音乐AI应用的开发门槛。
ACE-Step具备高效多元创作能力、强可控性和易于拓展的三大核心特色。它支持多种主流音乐风格的创作,能够生成丰富多样且兼具表现力的演唱和器乐编排,确保音乐的连贯性与和谐,并展现出风格的多样性。此外,ACE-Step还支持高质量的纯音乐生成。
ACE-Step提供两种生成模式:快速和慢速模式,最快15秒即可生成一整首歌,慢速模式也仅需32秒。它支持19种语言的歌曲生成,满足跨文化创作的需求。创作者可以在不改变旋律的情况下,精确修改已生成歌曲的歌词内容、语气或情感表达,确保每行歌词与整体音乐风格完美契合。
ACE-Step还具备高度的可拓展性,支持LoRA、ControlNet等主流微调方式,轻松适配多种音乐创作场景,满足个性化定制需求。它采用一阶段DiT架构,并结合REPA技术,通过语义约束提升生成的音频质量。同时,ACE-Step引入DCAE(深度压缩自编码器)技术和线性Transformer架构,显著提升了生成速度与效率。
ACE-Step的开源发布为全球创作者提供了更高效和灵活的创作工具。它展现了以下优势:全曲生成、精准时长控制、灵活输入格式以及多语言与多风格生成。未来,阶跃星辰与ACE Studio将进一步推动音乐模型技术演进,并探索在综合泛文娱产业的落地实践,为全球用户提供专业的音乐技术服务。
开源链接与体验地址:
– Github:(https://github.com/ace-step/ACE-Step)
本文由「aiuc」编辑整理,文章链接:https://www.aiuc.net/54713
该文观点仅代表作者本人,平台仅提供信息存储空间服务。