跳转到主要内容

阿里巴巴通义实验室发布Fun-ASR 1.5——支持30种语言甚至古诗的语音识别模型

阿里巴巴语音识别突破:可理解方言与古文

在快速发展的AI语音技术领域,一个新晋竞争者可能将彻底改变我们与机器的交互方式。阿里巴巴通义实验室最新发布的Fun-ASR1.5语音识别模型不仅能识别词汇——更能理解语境、方言乃至中国古诗的韵律复杂性。

超越字面的听觉

Fun-ASR1.5的非凡之处在于其覆盖范围。当多数语音识别系统还在主流语言中挣扎时,该模型已能处理:

  • 30种全球语言,具备母语级理解能力
  • 7种主要汉语方言及20余种地方口音
  • 古诗吟诵,包括独特的声调模式和古语结构

这项技术实现了语言学家所称的"深度适应"——它不仅识别声音,更能理解不同语言环境中语义的变化。

从课堂到会议室

已部署于阿里云百炼平台的Fun-ASR1.5即将改变多个领域:

教育: 设想能纠正普通话声调或逐行讲解古诗的语言学习应用。

媒体: 对方言采访的实时转录可能为新闻业带来革命。

金融: 跨多元客户群的声纹认证将更加可靠。

"我们不仅在打造工具,"通义实验室发言人解释道,"更在搭建桥梁——连接不同语言,通过经典文本连接不同世代,以及连接技术与人类表达。"

关键亮点:

  • 多语言精通: 以母语者准确度处理30种语言
  • 文化智能: 独特处理中国古诗吟诵
  • 方言多样性: 识别7种汉语方言及地域变体
  • 云端就绪: 现可通过阿里云百炼平台使用
  • 行业应用: 将变革教育、媒体、金融等领域

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

阿里Qwen3.6-Max-Preview:编程领域的新强者崛起
News

阿里Qwen3.6-Max-Preview:编程领域的新强者崛起

阿里巴巴最新推出的AI模型Qwen3.6-Max-Preview为编程智能树立了新标杆。该预览版在多项基准测试中超越前代,尤其在代理编程和世界知识方面表现突出。虽然仍在开发中,但它已展现出成为开发者寻求高级AI编程助手的潜在颠覆者。

April 20, 2026
AI编程阿里云Qwen系列
News

阿里云收紧百炼平台API访问权限

阿里云将于2026年4月28日起对百炼平台API实施新的速率限制,默认调用量设置为每秒10次查询,该公司表示该设置应能满足多数开发者需求。已升级配额的现有客户不受此次变更影响。

April 20, 2026
阿里云API管理云计算
阿里巴巴新款AI模型:小巧身躯蕴藏强大编程智慧
News

阿里巴巴新款AI模型:小巧身躯蕴藏强大编程智慧

阿里巴巴推出开源AI模型Qwen3.6-35B-A3B,在编程任务中展现出超越体量的实力。这款'专家混合'模型每次仅激活30亿参数,却能以更低算力超越更大规模的竞争对手。其在编码辅助、空间推理和视觉理解方面表现突出,已可媲美部分高端AI服务。开发者现可通过阿里云平台获取这一高效智能。

April 17, 2026
AI编程专家混合阿里云
News

阿里巴巴支持的AI公司通义云栖资本翻倍,开启战略扩张

阿里巴巴通义千问AI模型背后的公司通义云栖通过100%增资将注册资本扩大至2亿元人民币。这家杭州企业现股东包括阿里云及新增股东杭州通义实验室。该公司成立于2018年,持续拓展AI相关软硬件业务。

April 17, 2026
通义千问阿里云AI投资
阿里巴巴Meoo AI工具让无需编程即可建站成为可能
News

阿里巴巴Meoo AI工具让无需编程即可建站成为可能

阿里巴巴推出创新AI开发工具Meoo,通过简单文本描述即可创建网站,打破技术壁垒。该工具整合四大AI模型,支持在阿里云上即时生成并部署网页项目。目前已获阿里内部上万名员工采用,有望为非技术人员提供全民化的网站开发体验。

April 15, 2026
AI工具网站开发无代码技术
阿里巴巴旗下CoPaw更名为QwenPaw,深化与开源AI生态的关联
News

阿里巴巴旗下CoPaw更名为QwenPaw,深化与开源AI生态的关联

阿里巴巴的桌面AI助手CoPaw已完成重大品牌升级,以QwenPaw的全新身份亮相,彰显其与通义千问开源生态的深度融合。新版1.1.0承诺增强本地模型性能并简化部署选项,旨在成为OpenClaw的有力竞争者。凭借对主流平台的原生支持与灵活调优能力,QwenPaw志在成为您的首选数字伙伴。

April 13, 2026
AI助手阿里云开源AI