跳转到主要内容

钉钉与通义实验室联合推出Fun-ASR语音识别模型

钉钉与通义实验室发布Fun-ASR:语音识别技术的重大突破

钉钉通义实验室联合推出新一代语音识别模型Fun-ASR,旨在革新企业通信体验。这一先进模型擅长理解包括家装、畜牧业等十大行业的专业术语,同时支持企业定制化训练。

Fun-ASR的核心特性

Fun-ASR模型运用深度学习技术精准转写多样化语音信号,轻松处理多语言及口音差异。其突出特点是能够通过上下文提升转写准确率,特别适合对精度要求苛刻的企业场景。

Image

与钉钉的深度集成

Fun-ASR已无缝融入多项钉钉功能:

  • 会议字幕与实时翻译
  • 智能会议纪要
  • 语音助手

这些集成旨在为企业提供稳定、可扩展且高精度的语音识别基础架构,尤其适用于需要深度上下文理解的场景。

未来发展规划

尽管Fun-ASR已具备卓越性能,其潜力远未耗尽。钉钉通义实验室计划重点推进:

  1. 方言识别以适应地域性语言差异
  2. 噪声鲁棒性优化确保嘈杂环境下的清晰转写
  3. 多语言支持扩展提升全球适用性
  4. 企业深度定制服务打造专属商业解决方案

关键亮点:

  • 🎤 Fun-ASR支持跨行业术语理解及定制化训练
  • 📊 已集成至钉钉会议和语音助手功能
  • 🚀 未来升级将强化方言识别与噪声处理能力

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

微软全新AI转录工具树立准确度新标杆
News

微软全新AI转录工具树立准确度新标杆

微软发布MAI-Transcribe-1语音转文本模型,在25种语言中创下3.9%的词错率记录。这款经济实惠的解决方案(每小时0.36美元)在多语言场景中表现卓越,处理速度优于OpenAI和谷歌等竞争对手。此次发布巩固了微软在实用商业AI应用领域的领先地位。

April 3, 2026
微软人工智能语音识别转录技术
DeepSeek遭遇三日服务中断后恢复上线
News

DeepSeek遭遇三日服务中断后恢复上线

中国AI领军企业DeepSeek遭遇迄今最长服务中断,在持续三天的故障中系统瘫痪超10小时,波及网页聊天、移动应用及API服务。虽然公司已恢复运营,但该事件引发了对AI普及背景下基础设施韧性的质疑。科技界正密切关注——这些平台能否跟上爆炸式增长的需求?

April 1, 2026
AI技术故障云计算
小米AI模型凭借用户驱动成功跻身全球排行榜
News

小米AI模型凭借用户驱动成功跻身全球排行榜

小米的MiMo-V2-Pro在Text Arena的严格评估中位列全球前五大AI模型,这证明了其先进的推理和对话能力。CEO雷军强调了用户投票相比传统排名的重要性,展示了小米对实际性能的承诺。这一成就反映了公司在AI领域的重大投资及其将这些技术整合到整个生态系统的战略。

March 31, 2026
XiaomiAIMiMo-V2-Pro
微软VibeVoice AI为开源带来类人语音技术
News

微软VibeVoice AI为开源带来类人语音技术

微软发布了震撼开发者社区的强大开源语音AI系列VibeVoice。这些模型可处理长达90分钟的多说话人对话马拉松音频,同时保持自然流畅的情感表达。该项目迅速获得27,000个GitHub星标,提供从精准转录到富有表现力的语音生成等全套功能。其特别之处在于:无需云端费用的本地部署、多说话人支持以及可能彻底改变我们与语音技术交互方式的实时能力。

March 30, 2026
语音识别微软开源
News

Cohere以开源语音模型挑战科技巨头

AI公司Cohere发布了Transcribe,这是一款专为边缘设备设计的轻量级开源语音识别模型。支持14种语言,在解决延迟和隐私问题的同时性能超越竞争对手。这标志着Cohere从文本生成向语音AI的战略扩张,在快速增长的智能代理市场中与行业领导者展开竞争。

March 27, 2026
语音识别边缘AI开源
微软MAI-Image-2跻身全球AI图像生成三强
News

微软MAI-Image-2跻身全球AI图像生成三强

微软发布全新强力MAI-Image-2模型,现位列全球文本转图像AI系统前三甲。这项突破性技术解决了AI生成图像中文字乱码的长期问题,同时提供惊艳的视觉质量。用户已可免费测试该模型,微软计划很快将其整合至生产力工具中。

March 20, 2026
AIMicrosoftimage-generation