跳转到主要内容

阿里巴巴新AI语音几乎以假乱真

阿里巴巴发布新一代文本转语音技术

阿里云通过Qwen3-TTS模型将合成语音提升至新高度,其提供的自然音效模糊了人机界限。该系统拥有49种独特音色风格——从舒缓的旁白到活泼的客服代表——皆可一键调用。

Image

打破语言壁垒

Qwen3-TTS的突出优势在于卓越的语言灵活性。该模型能以惊人真实度处理十种语言及包括粤语和四川话在内的九种汉语方言。上海教师已开始使用"一键朗读"插件将教材转换为带有地方口音的生动音频课程。

"系统不仅转换文本,"阿里巴巴发言人解释道,"它理解语境、自然调整语调,甚至像人类说话者那样插入恰当停顿。"这种复杂处理方法使该技术获得4.53分(满分5分)的平均意见得分,远超行业标准。

技术优势

测试数据极具说服力。在与主流商业系统的严格对比中:

  • 英语单词错误率降至仅2.8%
  • 中文准确率提升至惊人的1.9%错误率 这些数据相较Azure TTS等竞品有显著提升。

普惠创新

阿里巴巴正降低这项强大工具的使用门槛:

  • 开发者每月可获100万字符免费额度
  • 付费方案起价仅¥0.80/万字符 用户现可通过阿里云控制台直接集成该模型。

未来展望

公司透露了明年年初的重大更新:

  • 仅需10秒样本音频即可实现声音克隆
  • 超高保真度的80kHz采样版本 这些升级或将彻底改变有声书制作和虚拟偶像内容生产。

当合成语音与真人发声难以区分时,Qwen3-TTS既代表着技术突破,也对AWS和Azure等传统巨头构成挑战。

核心亮点:

  • 49种音色风格覆盖多样化场景
  • 支持10种语言+9种汉语方言
  • 比主流商业方案准确率高24%
  • 免费层每月提供100万字符额度
  • 声音克隆功能将于2025年Q1上线

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

OpenAI挖角Meta明星研究员,硅谷AI人才争夺战白热化

本周,随着OpenAI成功从Meta挖来知名研究员Ruoming Pang,顶级AI人才的争夺战达到新高度。尽管Meta据称提供了2亿美元的薪酬方案,Pang在经过数月的接洽后仍选择加入Sam Altman的团队。这一高调跳槽凸显了科技巨头们在推动通用人工智能突破的专家争夺上的激烈竞争。

February 26, 2026
AISiliconValleyTechTalent
News

AI行业呈惊人增长态势,OpenAI估值飙升至8500亿美元

人工智能领域正经历前所未有的增长,OpenAI估值在短短六个月内飙升至8500亿美元。与此同时,印度企业巨头正对AI基础设施开发进行1.45万亿美元的巨额押注。尽管这些数字描绘出爆炸式扩张的景象,但如何将这些投资转化为可持续的技术领先地位仍面临挑战。

February 24, 2026
AIOpenAITechInvestment
阿里巴巴Qwen3.5 AI模型即将发布,具备视觉语言能力
News

阿里巴巴Qwen3.5 AI模型即将发布,具备视觉语言能力

阿里巴巴新一代AI模型Qwen3.5似乎已准备就绪,代码出现在HuggingFace仓库中。据报道,该模型采用混合注意力机制,并可能作为原生视觉语言模型(VLM)首次亮相。开发者发现了紧凑型2B密集模型和更强大的35B-A3B MoE变体的相关引用。若当前传闻属实,中国春节庆祝活动可能与AI社区这一重要的开源发布同时进行。

February 9, 2026
AIMachine LearningAlibaba
News

Anthropic以3500亿美元估值推出新股票计划,引发AI人才争夺战

AI巨头Anthropic正以3500亿美元员工股票出售计划震撼科技界,同时筹集超过20亿美元新资金。这一举措效仿了OpenAI等竞争对手的策略,旨在硅谷残酷的AI竞争中留住顶尖人才。随着各公司争抢工程师和研究人员,早期股权变现正成为新的金手铐。

February 4, 2026
AI风险投资科技人才
苹果支持应用更智能:AI助手结束测试阶段
News

苹果支持应用更智能:AI助手结束测试阶段

苹果最新支持应用更新带来重大变化。AI助手已摘除'早期预览'标签,表明对其处理客户查询能力的信心。新诊断工具让用户无需前往门店即可检查设备健康状况。这些升级反映了苹果通过自动化使技术支持更易获取的推动。

February 4, 2026
AppleTechSupportAI
Fitbit创始人携AI驱动的家庭健康平台回归
News

Fitbit创始人携AI驱动的家庭健康平台回归

Fitbit联合创始人James Park带着新项目Luffu重出江湖。这个由人工智能驱动的平台旨在通过将医疗记录、日常作息和通讯整合到一个直观系统中,解决家庭医疗保健的混乱现状。源于Park个人护理经历中的困境,Luffu承诺为数百万管理家庭健康的人们减轻精神负担。

February 4, 2026
healthtechAIcaregiving