跳转到主要内容

腾讯AI实验室开源音乐生成模型SongGeneration

腾讯AI实验室发布开源音乐生成模型

腾讯AI实验室正式推出SongGeneration——一个专为音乐创作设计的开源大语言模型。这一创新系统攻克了AI生成音乐领域的三大长期挑战:音频保真度音乐连贯性计算效率

技术架构与核心能力

该模型采用融合式架构,结合多种神经网络方法,在保持快速生成速度的同时实现卓越音质。独立测试表明,SongGeneration在特定性能指标上超越多个商业闭源模型。

Image

主要功能包括:

  • 文本转音乐:用户输入描述性关键词即可生成完整乐曲
  • 风格适配:系统分析上传的参考曲目以生成具有相同特征的新音乐
  • 多轨合成:支持流行、摇滚、电子等跨流派的分层乐器编排

数据管道与训练过程

开发团队构建了包含以下要素的完整数据处理流程:

  1. 先进的声音分离算法
  2. 音乐结构分析模块
  3. 自动化歌词识别系统

凭借约30亿参数规模,SongGeneration基于海量中英文音乐作品进行了预训练。这种多样化的训练数据使模型能够处理跨文化音乐风格与惯例。

行业影响

SongGeneration标志着音乐制作民主化的重要一步。此次开源将提供:

  • 独立内容创作者的新工具包
  • 游戏开发者获取原创配乐的增强能力
  • 专业音乐人寻求灵感的创意助手

    该模型符合腾讯构建创意产业开放AI生态的宏观愿景。

    获取方式

    目前可通过Hugging Face平台访问该模型:https://huggingface.co/spaces/tencent/SongGeneration

    核心亮点:

  • 🎵 开源架构搭载30亿参数并支持多语种音乐数据训练
  • 🎤 直观界面兼容文本提示与音频参考的风格匹配功能
  • 优化性能平衡生成速度与输出质量
  • 🌐 跨流派能力覆盖从流行乐到摇滚乐的创作需求

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

谷歌Nano Banana Pro风靡全球:短短2个月生成10亿张图片
News

谷歌Nano Banana Pro风靡全球:短短2个月生成10亿张图片

谷歌最新图像生成工具Nano Banana Pro(官方名Gemini3Pro Image)席卷创意界。自11月发布以来,全球用户利用其影棚级编辑功能已生成惊人的10亿张图片。该模型提供专业级的灯光、焦点和构图控制,同时支持高分辨率多语言文本生成。谷歌还推出了分级访问机制,免费用户每日生成次数有限,而订阅用户则可享受更高的配额。

January 13, 2026
AI成像Google Gemini创意工具
News

DeepSeek发现更智能的AI未必需要更大的模型

DeepSeek最新研究揭示了人工智能发展的重大突破——优化神经网络架构比单纯扩大模型规模更能有效提升推理能力。他们创新的'流形约束超连接'方法在仅增加极小训练成本的情况下,将复杂推理准确率提高了7%以上,挑战了业界对不断增大模型的执着追求。

January 4, 2026
AI研究机器学习神经网络
News

元象科技推出XVERSE-Ent,为娱乐产业注入AI创造力

中国科技企业元象科技发布了专为娱乐应用设计的开源AI模型XVERSE-Ent。与通用模型不同,这个双语系统专注于社交互动、游戏叙事和文化内容创作。提供适合消费级硬件的轻量版本和商业友好型许可协议,有望实现创意AI工具的民主化。

January 4, 2026
AI创新娱乐科技创意工具
News

三星Exynos 2600将强大AI引入小型设备

三星正与韩国AI专家Nota合作,为其即将推出的Exynos 2600芯片大幅压缩AI模型。他们的秘密武器?Nota的NetsPresso平台可在不牺牲性能的情况下将AI模型压缩90%以上。这一突破意味着您的下一部手机无需云端支持即可离线处理图像生成等复杂AI任务。双方还致力于简化Exynos平台的AI开发流程。

December 30, 2025
移动技术AI芯片三星
Blender艺术家坚守传统工具:调查显示仅7%接纳AI
News

Blender艺术家坚守传统工具:调查显示仅7%接纳AI

Blender基金会最新调查揭示了3D创作者中的意外趋势。尽管AI技术快速发展,超半数专业用户完全回避使用该技术,仅7%会定期将其纳入工作流程。研究结果表明,在需要艺术精度的领域,传统技艺仍占主导地位。

December 30, 2025
Blender3D建模数字艺术
News

腾讯AI实验室震荡:战略重组下资深负责人离职

腾讯AI部门迎来关键时刻,其AI实验室副主任兼混元项目核心架构师汤道权博士在任职八年后卸任。这家科技巨头通过从竞争对手处招揽顶尖人才并整合分散的AI资源作出回应。随着大模型竞赛白热化,腾讯的重组或将决定其能否与竞争对手保持同步。

December 29, 2025
腾讯AI领导层变动大语言模型