智谱AI发布开源语音技术,带来更智能的语音输入体验
智谱AI为语音识别树立新标杆
中国AI企业智谱刚刚发布了可能改变人机交互方式的重大升级。其全新GLM-ASR语音识别模型不仅更智能——还通过开源许可向全球开放。

主打产品是基于云的GLM-ASR-2512,其字符错误率低于0.072%,达到行业领先的准确度。这意味着即使在口音差异或嘈杂环境中,正确率仍超过99.9%。
"我们想打造在繁忙咖啡馆和安静办公室都能同样出色的产品,"智谱技术负责人解释道。该模型能无缝处理多种语言,非常适合全球用户。
小身材大能量
针对注重隐私或需要离线使用的用户,智谱推出了GLM-ASR-Nano-2512——这个仅15亿参数的紧凑版本表现出色。测试显示其性能超越某些专有系统,且可直接在设备上运行。
这种本地处理意味着您的语音数据保持私密而无需上传至远程服务器,同时显著降低延迟——您说的话几乎能即时转为文字。
让电脑更懂对话
该技术驱动了智谱焕新的AI输入法,将PC变成响应灵敏的语音助手。除基础听写外,还能实现语言间即时翻译或按指令改写文本——宛如键盘里住着一位秘书。
早期用户可获得2000免费积分(约四周常规使用量)体验以下功能:
- 实时语音转文字
- 多语言翻译
- 智能文本改写
- 跨平台同步
当前桌面版支持Windows和macOS系统,移动版本据悉正在开发中。
重要意义
通过技术开源,智谱邀请全球开发者在其基础上创新而非封锁技术进步。这种方式可能加速从无障碍工具到智能家居设备等各领域的突破。
新版输入法也暗示了计算机界面的未来方向——让系统理解自然语音变得像处理鼠标点击一样 effortless 。
核心亮点:
- 🎙️ 两款新语音模型:云端旗舰版+注重隐私的本地版
- 💻 升级输入法新增语音翻译与文本编辑
- 🆓 丰厚试用期畅享高级功能
- 🔓 开源策略促进更广泛创新



