跳转到主要内容

阿里巴巴新AI语音几乎以假乱真

阿里巴巴发布新一代文本转语音技术

阿里云通过Qwen3-TTS模型将合成语音提升至新高度,其提供的自然音效模糊了人机界限。该系统拥有49种独特音色风格——从舒缓的旁白到活泼的客服代表——皆可一键调用。

Image

打破语言壁垒

Qwen3-TTS的突出优势在于卓越的语言灵活性。该模型能以惊人真实度处理十种语言及包括粤语和四川话在内的九种汉语方言。上海教师已开始使用"一键朗读"插件将教材转换为带有地方口音的生动音频课程。

"系统不仅转换文本,"阿里巴巴发言人解释道,"它理解语境、自然调整语调,甚至像人类说话者那样插入恰当停顿。"这种复杂处理方法使该技术获得4.53分(满分5分)的平均意见得分,远超行业标准。

技术优势

测试数据极具说服力。在与主流商业系统的严格对比中:

  • 英语单词错误率降至仅2.8%
  • 中文准确率提升至惊人的1.9%错误率 这些数据相较Azure TTS等竞品有显著提升。

普惠创新

阿里巴巴正降低这项强大工具的使用门槛:

  • 开发者每月可获100万字符免费额度
  • 付费方案起价仅¥0.80/万字符 用户现可通过阿里云控制台直接集成该模型。

未来展望

公司透露了明年年初的重大更新:

  • 仅需10秒样本音频即可实现声音克隆
  • 超高保真度的80kHz采样版本 这些升级或将彻底改变有声书制作和虚拟偶像内容生产。

当合成语音与真人发声难以区分时,Qwen3-TTS既代表着技术突破,也对AWS和Azure等传统巨头构成挑战。

核心亮点:

  • 49种音色风格覆盖多样化场景
  • 支持10种语言+9种汉语方言
  • 比主流商业方案准确率高24%
  • 免费层每月提供100万字符额度
  • 声音克隆功能将于2025年Q1上线

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

阿里巴巴Qwen3.5 AI模型即将发布,具备视觉语言能力
News

阿里巴巴Qwen3.5 AI模型即将发布,具备视觉语言能力

阿里巴巴新一代AI模型Qwen3.5似乎已准备就绪,代码出现在HuggingFace仓库中。据报道,该模型采用混合注意力机制,并可能作为原生视觉语言模型(VLM)首次亮相。开发者发现了紧凑型2B密集模型和更强大的35B-A3B MoE变体的相关引用。若当前传闻属实,中国春节庆祝活动可能与AI社区这一重要的开源发布同时进行。

February 9, 2026
AIMachine LearningAlibaba
News

Anthropic以3500亿美元估值推出新股票计划,引发AI人才争夺战

AI巨头Anthropic正以3500亿美元员工股票出售计划震撼科技界,同时筹集超过20亿美元新资金。这一举措效仿了OpenAI等竞争对手的策略,旨在硅谷残酷的AI竞争中留住顶尖人才。随着各公司争抢工程师和研究人员,早期股权变现正成为新的金手铐。

February 4, 2026
AI风险投资科技人才
苹果支持应用更智能:AI助手结束测试阶段
News

苹果支持应用更智能:AI助手结束测试阶段

苹果最新支持应用更新带来重大变化。AI助手已摘除'早期预览'标签,表明对其处理客户查询能力的信心。新诊断工具让用户无需前往门店即可检查设备健康状况。这些升级反映了苹果通过自动化使技术支持更易获取的推动。

February 4, 2026
AppleTechSupportAI
Fitbit创始人携AI驱动的家庭健康平台回归
News

Fitbit创始人携AI驱动的家庭健康平台回归

Fitbit联合创始人James Park带着新项目Luffu重出江湖。这个由人工智能驱动的平台旨在通过将医疗记录、日常作息和通讯整合到一个直观系统中,解决家庭医疗保健的混乱现状。源于Park个人护理经历中的困境,Luffu承诺为数百万管理家庭健康的人们减轻精神负担。

February 4, 2026
healthtechAIcaregiving
谷歌Project Genie将草图变为可玩世界
News

谷歌Project Genie将草图变为可玩世界

谷歌DeepMind发布了Project Genie,这款AI工具能将文本提示或简单绘画转化为交互式虚拟环境。它融合了多种先进AI模型,让用户即时生成并探索个性化数字世界——从外星景观到丛林冒险——且具备实时响应能力。目前该技术处于严格限时的早期测试阶段,预示着游戏、电影制作和教育领域的革命性应用前景。

February 2, 2026
AIVirtualRealityGoogleDeepMind
优必选Thinker模型:智能机器人的革命性突破
News

优必选Thinker模型:智能机器人的革命性突破

优必选开源了其Thinker模型,这是机器人AI领域的一项重大突破,解决了空间理解和视觉感知等关键挑战。通过将原始数据从200亿条精炼至仅1000万条,并将标注成本降低99%,Thinker有望彻底改变机器人的学习和操作方式。此举或将加速整个机器人行业的创新进程。

February 2, 2026
roboticsAImachine learning