腾讯正式开源AI歌曲生成项目SongGeneration,基于创新LeVo架构实现高品质音乐创作,为音乐产业带来智能化创作新范式。
【免费下载链接】SongGeneration腾讯开源SongGeneration项目,基于LeVo架构实现高品质AI歌曲生成。它采用混合音轨与双轨并行建模技术,既能融合人声与伴奏达到和谐统一,也可分别处理实现更高音质。模型在百万歌曲数据集上训练,支持中英文生成,效果媲美业界顶尖系统,为音乐创作带来突破性AI解决方案项目地址: https://ai.gitcode.com/tencent_hunyuan/SongGeneration
近年来,AI音乐生成技术经历了从简单旋律合成到多轨音乐创作的跨越式发展。据相关数据显示,2024年全球AI生成音乐市场规模已突破12亿美元,预计2025年将保持85%的增长率。在这一背景下,腾讯推出的SongGeneration项目凭借其技术突破性,正重新定义AI音乐创作的质量标准与应用边界。
作为腾讯AILab的旗舰级音乐生成模型,SongGeneration采用独创的LeVo架构,通过混合音轨与双轨并行建模技术构建双重优势。该模型创新性地设计了混合 tokens 和双轨 tokens 并行处理机制:混合 tokens 负责融合人声与伴奏的和谐统一,确保音乐整体情感表达的完整性;双轨 tokens 则独立编码人声与伴奏信号,实现各声部的高保真还原。这种架构设计使模型在百万歌曲数据集训练后,既能生成情感连贯的完整歌曲,又能满足专业制作中对分轨音质的严苛要求。
这一标志生动展现了SongGeneration的核心定位——通过AI技术赋能音乐创作。企鹅形象呼应腾讯品牌基因,吉他与音乐符号则直观传递音乐生成功能,彩色波浪线条象征AI算法对声音的精准处理。
目前模型已发布多个版本,基础版支持2分30秒时长的中英文歌曲生成,仅需10G显存即可运行;进阶的large版本将生成时长提升至4分30秒,RFT(相对保真度)指标达1.51,音质媲美专业录音室制作水准。更值得关注的是即将推出的v1.5系列,计划支持英、中、西班牙、日语等多语言创作,进一步拓宽全球音乐人的创作可能性。
SongGeneration的开源释放将对音乐产业产生多维度影响。对于独立音乐人,该工具大幅降低创作门槛,从旋律构思到编曲制作的流程时间可缩短70%以上;在内容生产领域,商业宣传片、短视频等场景的背景音乐制作成本将显著降低;教育领域则可借助该技术开发交互式音乐教学系统。随着模型支持多语言和更长时长创作,未来可能催生AI辅助的跨文化音乐合作新模式。
作为国内首个开源的专业级AI歌曲生成系统,SongGeneration不仅展现了中国AI技术在音视频生成领域的领先地位,更通过开源生态推动整个行业的技术迭代。随着模型持续优化和多语言版本的落地,我们有理由期待AI音乐创作从辅助工具向创意伙伴的角色转变,最终形成人机协同的新型音乐创作生态。
【免费下载链接】SongGeneration腾讯开源SongGeneration项目,基于LeVo架构实现高品质AI歌曲生成。它采用混合音轨与双轨并行建模技术,既能融合人声与伴奏达到和谐统一,也可分别处理实现更高音质。模型在百万歌曲数据集上训练,支持中英文生成,效果媲美业界顶尖系统,为音乐创作带来突破性AI解决方案项目地址: https://ai.gitcode.com/tencent_hunyuan/SongGeneration
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考