跳转到主要内容

阿里巴巴新AI语音技术可在数秒内克隆声音

阿里巴巴突破性推出闪电级语音AI

Image

阿里巴巴研究团队刚刚开源了可能是目前响应速度最快的文本转语音系统。Qwen3-TTS并非传统的机械音生成器——它仅需听取3秒音频就能克隆人声,并让该声音流畅地说出十种不同语言。

快于人类反应时间

真正的魔力在于其响应速度。凭借97毫秒延迟,其反应速度比人类平均眨眼时间(约100-150毫秒)更快。这种速度源于其独特的双轨架构,与传统系统的语音处理方式截然不同。当老旧技术可能出现卡顿时,Qwen3-TTS几乎能在接收文本输入后立即开始发声。

一种声音,多种语言

想象录制你说"你好"的3秒音频后,就能听到相同的声线完美地用日语或德语发表演讲——这正是该系统实现的功能。克隆声音在适应新语言时能保持原始特征,包括四川话等中国方言的准确演绎。

无需录音棚定制声线

除克隆外,创作者可通过简单指令设计全新声线:

  • "讲睡前故事的祖父般嗓音"
  • "充满活力的体育解说员"
  • "舒缓的冥想引导者"

系统会自动调整语调、情感和语速。这将彻底改变有声书制作模式,单个叙述者即可逼真演绎整个角色阵容。

双版本满足不同需求

团队发布两种模型规格:

  • 17亿参数版:云端应用的最高质量选择
  • 6亿参数版:移动设备的轻量级选项

两个模型均在GitHub和Hugging Face平台开放下载,支持完整定制功能。

该技术显著降低了开发者创建多语言语音助手、互动娱乐和全球无障碍内容的门槛。

核心亮点:

  • 仅需3秒音频即可克隆声线
  • 用原始音色流畅表达10+种语言
  • 响应速度快于人类眨眼(97毫秒延迟)
  • 通过文字描述创造定制声线
  • 提供云端版与移动端适配版本

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

英伟达撤资OpenAI:十亿美元合作伙伴关系降温

英伟达出人意料地决定缩减对OpenAI的数十亿美元投资,标志着人工智能行业风向的转变。这家芯片巨头的CEO近期表示其30亿美元的承诺可能是最后一笔,较此前100亿美元的合作计划大幅收缩。此举正值OpenAI面临高管离职和伦理争议等内部动荡之际。行业观察家认为,英伟达的行动既是对OpenAI不稳定性的回应,也是对潜在人工智能估值泡沫的谨慎防范。

March 9, 2026
人工智能投资英伟达OpenAI
News

谷歌豪掷40亿美元在柏林新建AI中心,彰显欧洲战略布局

谷歌通过柏林大型研究中心公布了其雄心勃勃的欧洲AI战略。这家科技巨头首次将DeepMind、Google Research和Google Cloud三大部门整合于同一屋檐下,计划到2029年在德国总投资达55亿欧元。此举将使谷歌得以进军蓬勃发展的欧洲AI市场——预计到2034年每年将为德国经济贡献4400亿欧元。

March 9, 2026
人工智能科技投资欧洲科技
News

大学编程奇才凭借预测未来AI获400万美元投资

大四学生郭杭江凭借其AI预测引擎'MiroFish'震撼科技界。该项目登顶GitHub趋势榜后,吸引了盛大集团创始人陈天桥的目光并获得3000万元投资。这个多智能体系统通过创建现实场景的数字模拟,能以惊人准确度预测结果。

March 9, 2026
人工智能科技创业预测分析
News

博通豪赌AI芯片:2027年实现1000亿美元营收目标

博通CEO陈福阳在周三的财报电话会议上大胆预测震惊投资者,预计三年内AI芯片营收将突破1000亿美元大关。在强劲的第一季度业绩(显示AI收入翻倍至84亿美元)推动下,这一公告使博通盘后股价飙升逾5%。随着谷歌和Meta等科技巨头对定制芯片的需求激增,博通似乎已做好准备抓住AI硬件热潮的机遇。

March 6, 2026
半导体人工智能科技行业
News

科技巨头陈天桥携20亿美元押注下一代AI重出江湖

在公众视野消失近十年后,盛大集团创始人陈天桥带着革新人工智能的雄心计划重新现身。这位前游戏大亨正投入20亿美元开发他称之为'发现型AI'的系统——这些系统不仅旨在模仿人类思维,更要超越它。他的愿景包括在70万英亩土地上建设地热供电的数据中心,以及通过神经科学与计算机科学相结合的独特方法实现真正的人工通用智能。

March 6, 2026
人工智能科技创新商业回归
NVIDIA黄仁勋称OpenClaw为当今时代定义性软件
News

NVIDIA黄仁勋称OpenClaw为当今时代定义性软件

在摩根士丹利技术大会上,NVIDIA首席执行官黄仁勋发表震撼言论,将OpenClaw称为当今最具影响力的软件发布。这个开源项目仅用三周时间就实现了Linux耗时三十年才达成的成就——成为史上下载量最大的开源软件。黄仁勋阐述了他关于AI基础设施的'五层蛋糕'理论,并解释像OpenClaw这样的代理式AI如何创造了前所未有的计算需求。

March 6, 2026
人工智能科技创新开源