跳转到主要内容

阿里巴巴Fun-ASR模型将语音识别准确率提升15%

阿里巴巴Fun-ASR模型创语音识别新标杆

阿里巴巴通义近日发布其Fun-ASR端到端语音识别模型的重大升级版本,在专业行业应用中实现超过15%的准确率提升。增强后的模型在保险、家装、畜牧等垂直领域表现尤为突出,测试数据显示保险相关语音识别的准确率较前代版本提高了18%

推动性能的技术创新

这一突破源于多项关键技术进展:

  • 上下文感知算法:提升对行业专业术语和短语的理解能力
  • Qwen3监督微调:通过先进训练技术提高模型精度
  • RAG检索增强:支持导入1000+自定义热词实现领域定制优化

Image

解决行业痛点

研发团队通过创新方案攻克了语音识别的长期难题:

  • 强化学习(RL)整合:通过动态优化策略减少错误
  • 方言识别:在四川话、粤语和闽南语中表现优异
  • 环境适应性:适用于从会议室到户外等多种场景

该模型的训练纳入了数亿小时的音频数据及来自十余个行业的专业术语,使其在细分应用中表现卓越。例如,即使在背景噪音下也能准确识别畜牧环境中的动物声音和指令。

未来应用与影响

阿里巴巴技术团队强调,Fun-ASR标志着从通用型向专业化语音识别的转变。随着在各行业的部署扩展,其动态热词更新和多模态能力有望彻底改变语音交互效率。

核心亮点

  • 在保险、家装等垂直行业实现15-20%准确率提升
  • 结合Qwen3微调与RAG检索增强实现领域定制优化
  • 通过基于强化学习的错误减少机制在复杂环境中表现突出
  • 基于海量数据集训练并深度融合行业术语
  • 有望推动专业语音交互应用创新

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

英伟达通过收购SchedMD及发布新模型推动开源AI发展

英伟达在开源AI领域掀起波澜,采取了两大重要举措。这家科技巨头收购了广受欢迎的Slurm工作负载管理器背后的公司SchedMD,同时承诺保持其开源状态。与此同时,英伟达发布了Nemotron 3 AI模型系列和一款用于自动驾驶研究的新视觉语言模型,彰显其对物理AI应用日益增长的投入。

December 16, 2025
Nvidiaopen-sourceAI-models
DeepSeek-V3.2-Exp 重磅发布,价格大幅下调
News

DeepSeek-V3.2-Exp 重磅发布,价格大幅下调

Silicon-based Flow 发布了实验性 AI 模型 DeepSeek-V3.2-Exp,该模型具备 160K 上下文长度,价格降幅超过 50%。此次更新引入了先进的稀疏注意力技术,同时保持了性能基准。平台仍继续提供稳定的生产环境版本 V3.1-Terminus。

October 11, 2025
AI-modelsDeepSeekSiliconFlow
Ling-flash-2.0以创纪录的推理速度正式发布
News

Ling-flash-2.0以创纪录的推理速度正式发布

Silicon-Based Flow推出了基于MoE架构的尖端语言模型Ling-flash-2.0,该模型拥有100亿参数。在保持成本效益的同时,该模型在复杂推理和代码生成方面表现出色。输出速度超过每秒200个token,为推理速度树立了新标杆。

September 18, 2025
AI-modelsNatural-Language-ProcessingMachine-Learning
腾讯云调整AI定价策略:免费试用终结,成本上升
News

腾讯云调整AI定价策略:免费试用终结,成本上升

腾讯云正通过自2026年3月起实施的重要定价调整在AI行业掀起波澜。该平台将终止三款热门模型的免费试用,并对其混元系列产品重新制定价格策略。虽然开发者面临新的成本压力,但腾讯将此视为迈向可持续AI服务的关键一步。这些变化反映了AI技术从实验阶段转向商业可行性的行业大趋势。

March 12, 2026
AI定价腾讯云生成式AI
ComfyUI通过全新应用模式简化AI工作流程
News

ComfyUI通过全新应用模式简化AI工作流程

热门生成式AI工作流工具ComfyUI推出颠覆性更新,将复杂节点图转化为用户友好的应用程序。通过App Mode、App Builder和ComfyHub三大新功能,该平台正在弥合技术专家与普通用户之间的鸿沟。现在任何人都能通过简单网页应用运行复杂AI工作流,无需编码或昂贵硬件。

March 12, 2026
ComfyUIGenerativeAIAIAccessibility
字节跳动引入通义千问资深专家俞伯文强化AI团队
News

字节跳动引入通义千问资深专家俞伯文强化AI团队

阿里巴巴通义千问AI模型的核心架构师俞伯文据悉已加入字节跳动Seed团队。此举紧随阿里云通义实验室近期重组,标志着中国蓬勃发展的AI大模型领域对顶尖人才的争夺日趋激烈。随着行业领导者竞相开发下一代视觉理解能力,字节跳动获得了多模态AI领域的深厚专业知识。

March 12, 2026
AI人才字节跳动多模态AI