跳转到主要内容

面壁智能发布VoxCPM:语音合成领域的重大突破

面壁智能发布VoxCPM:语音合成领域的重大突破

语音合成技术快速发展的背景下,面壁智能与清华大学人机语音交互实验室(THUHCSI)联合发布了新一代高保真语音生成模型VoxCPM。这款拥有5亿参数的开源创新成果,在AI语音应用中实现了前所未有的自然度和多功能性。

技术优势与性能表现

VoxCPM在三个关键指标上达到了行业领先水平:

  • 自然度:类人的韵律和语调
  • 声音相似度:零样本克隆测试准确率达94%
  • 实时因子(RTF):在NVIDIA RTX4090硬件上达到0.17

该模型架构结合了扩散自回归生成与分层语言建模,能够根据情感线索和文本内容进行上下文感知的语音合成。

Image

主要应用场景

  1. 个性化语音助手:仅需3秒音频即可克隆声音
  2. 媒体制作:为游戏/动画生成角色语音
  3. 无障碍工具:为视障用户创建自然流畅的TTS
  4. 多语言支持:目前支持8种语言并计划扩展

该模型在Seed-TTS-EVAL基准测试中表现优于竞争对手,具体数据如下:

  • 词错误率(WER):90%
  • 情感准确率:人类评估匹配率达87%

获取方式与实施方案

VoxCPM可通过以下平台获取:

团队提供了交互式演示音频样本,展示方言适应能力和情感表达范围。

核心亮点

  • 首个实现24kHz采样率录音棚级音质的开源模型
  • 相较先前方案减少90%的声音克隆数据需求
  • 在消费级GPU上实现每秒100词的处理速度
  • 在教育、娱乐和企业解决方案中具有广泛应用潜力

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

快手AI视频工具年收入突破2.4亿美元里程碑

快手的视频生成AI工具Kling在推出仅19个月后便达到惊人的财务高度。该平台目前月收入超过2000万美元,为全球6000万创作者提供服务。其成功源于持续创新,包括突破性的多模态视频能力,解决了行业长期存在的挑战。

January 14, 2026
生成式AI视频创作科技增长
News

软件巨头IgniteTech的激进AI转型:裁员80%引发行业争议

IgniteTech首席执行官Eric Vaughan掀起波澜,他透露公司裁撤了80%抵制其激进AI转型的员工。这一争议策略包括强制推行'AI星期一'活动,并最终用专注于AI的人才取代了不愿改变的员工。尽管过程痛苦,但此举似乎已见成效——新专利涌现且利润飙升,这引发了关于AI时代劳动力适应的尖锐问题。

January 13, 2026
AI转型劳动力动荡企业重组
News

AI短剧蓄势待发:科技巨头推出颠覆性工具

短剧行业即将迎来巨变。阅文集团、中文在线等领先平台发布了革命性的AI制作工具,实现了从剧本创作到最终剪辑的全流程自动化。这些创新技术有望大幅缩短制作周期,同时解决角色跨集一致性的行业难题。随着TikTok激励计划刺激需求增长,专家预测到2026年将涌现大量高质量3D短剧,为IP持有者和精通技术的创作者带来新机遇。

January 13, 2026
AI视频制作短视频内容数字娱乐
News

腾讯推出'委屈青蛙',让Z世代用AI玩转故事创作

腾讯正在测试一款名为'委屈青蛙'的创新小程序,将AI叙事与用户互动相结合。与被动的内容平台不同,它让年轻用户通过选择和指令塑造故事情节,围绕协作叙事创造社交空间。虽然仍在测试阶段,这一实验可能为TikTok世代重新定义数字娱乐。

January 9, 2026
生成式AI互动媒体腾讯
News

智谱AI香港首秀大涨,乘中国生成式AI热潮

中国AI公司智谱AI今日在香港交易所强势首秀,开盘股价上涨3%。该公司通过IPO募集43亿港元(约合5.5亿美元),标志着中国蓬勃发展的生成式AI领域又一里程碑。尽管展现出超过130%的年复合增长率,但由于高昂的研发投入——这是争夺技术领先地位的AI初创企业的普遍挑战——智谱仍面临亏损扩大的困境。

January 8, 2026
人工智能IPO中国科技
有道AI笔现可如人类导师般讲解数学题
News

有道AI笔现可如人类导师般讲解数学题

网易有道升级其AI问答笔,推出中国首个视频讲解功能。它不再提供静态答案,而是生成个性化的白板式教学视频,适应学生需求——甚至能响应'讲得更有趣些'这类要求。该产品融合两种AI模型打造动态课程,标志着从文本学习到互动视频辅导的转变。

January 6, 2026
教育科技生成式AI智慧学习