跳转到主要内容

阿里巴巴发布FunAudio-ASR语音识别系统,突破性降噪技术引领行业

阿里巴巴FunAudio-ASR重新定义语音识别标准

阿里巴巴集团通义实验室推出的FunAudio-ASR是一款端到端语音识别模型,通过创新的上下文模块显著提升了嘈杂环境下的识别准确率。这项技术进步将幻听率从78.5%降至仅10.7%,实现近70%的改善,为行业设立了新基准。

Image

技术突破

该模型基于数千万小时的音频数据训练而成,并整合了大语言模型的语义理解能力。测试显示在以下挑战性场景中表现优于Seed-ASR和KimiAudio-8B等竞品:

  • 远场音频采集
  • 高噪声环境
  • 多人讲话场景

该系统在会议、公共场所等传统上受背景噪音影响识别质量的商业应用中表现尤为突出。

部署选项

为满足不同用户需求,阿里巴巴提供:

  1. 完整版:为企业应用提供最高精度
  2. FunAudio-ASR-nano轻量版:在降低计算需求的同时保留核心功能

轻量版变体可在各种硬件配置上实现经济高效的部署,而不会造成显著的性能损失。

Image

当前应用案例

该技术已赋能多个实际应用场景:

  • 钉钉"AI笔记"功能
  • 视频会议系统
  • 钉钉A1硬件设备 开发者可通过阿里云百炼平台访问API,轻松集成至现有系统。

行业影响

此次发布标志着以下领域的重大进步:

  • 商务通讯工具
  • 无障碍技术
  • AI转录服务 通过显著提升嘈杂环境下的可靠性,FunAudio-ASR消除了语音识别广泛普及的主要障碍。

关键亮点:

  • 幻听率降低70%,相较前代解决方案 上下文模块实现前所未有的准确度提升 双版本部署满足不同资源需求 已在阿里巴巴商务通讯生态中全面应用 API开放加速第三方采用

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

Step-Audio-R1.1 打破纪录,成为新一代语音AI冠军
News

Step-Audio-R1.1 打破纪录,成为新一代语音AI冠军

StepZen Star 的开源语音模型 Step-Audio-R1.1 超越了科技巨头的产品,在全球 AI 评估中以破纪录的 96.4% 准确率脱颖而出。这一创新模型结合了类人推理与实时响应能力,通过流式推理让用户能够边思考边说话。开发者现已可通过 HuggingFace 体验其突破性技术。

January 15, 2026
语音识别AI突破开源技术
News

智能吸尘器随AI清洁技术浪潮席卷千家万户

扫地机器人已从笨拙的小工具进化为智能家居助手,2025年全球出货量激增近19%。如今的型号能避开鞋子与宠物排泄物、响应语音指令,甚至学习清洁偏好。市场数据显示消费者越来越重视这些智能功能而非单纯吸力。

January 12, 2026
智能家居人工智能技术消费电子
美图股价飙升11%,AI热潮带动香港科技股上涨
News

美图股价飙升11%,AI热潮带动香港科技股上涨

香港数字板块今日表现强劲,照片编辑应用美图领涨。其股价飙升近12%,推动市值突破400亿港元。分析师指出,对创意AI工具日益增长的需求以及与阿里巴巴的重大合作是此次上涨的关键驱动力。

January 12, 2026
港股人工智能技术数字创意
Mistral AI的Voxtral模型现已在Amazon SageMaker上推出
News

Mistral AI的Voxtral模型现已在Amazon SageMaker上推出

Mistral AI推出了创新的Voxtral模型,以强大的新方式结合了文本和音频处理。轻量级的Voxtral-Mini适用于快速转录,而功能强大的Voxtral-Small则能处理复杂的多语言任务。通过灵活的容器部署方式,Amazon SageMaker现已支持这些模型,为企业实施先进的音频-文本智能解决方案打开了大门。

December 23, 2025
AI技术语音识别云计算
微信输入法iOS大更新:方言支持与隐私保护成亮点
News

微信输入法iOS大更新:方言支持与隐私保护成亮点

微信输入法iOS应用迎来3.0版本重大升级,带来突破性语音识别功能。该更新支持15种汉语方言自动识别,取消语音输入时长限制,并具备离线工作能力——同时始终将用户隐私放在首位。这标志着微信从键盘输入向专业语音交互平台的转型。

December 17, 2025
WeChat语音识别iOS应用
智谱AI发布开源语音技术,带来更智能的语音输入体验
News

智谱AI发布开源语音技术,带来更智能的语音输入体验

智谱AI以两款强大新模型颠覆语音识别领域——包括可在本地运行的轻量级版本以增强隐私保护。其升级后的输入法现能以惊人准确度将语音转为文字,并新增翻译等实用功能。新用户可享受丰厚的免费试用期来体验这些尖端工具。

December 10, 2025
AI语音识别效率工具