跳转到主要内容

新基准测试旨在让AI电话通话更显人性化

AI电话通话迎来首次现实检验

多年来,使用AI进行客户呼叫的企业一直缺乏明确的性能衡量标准。随着声网与美团合作推出VoiceAgentEval——业界首个AI外呼综合评估系统,这一现状终被改变。

突破实验室局限

新基准测试的突出特点在于聚焦真实商业场景而非人工实验室测试。"我们希望创建能真实反映这些系统与客户互动情况的标准",项目负责人解释道。

主要特性包括:

  • 覆盖六大业务领域的30个具体场景
  • 采用真实对话数据而非脚本化交互
  • 对文本逻辑和语音表达的双重评估

严苛测试AI能力

该系统通过150组精心设计的对话模拟对AI模型进行严格测试。这就像给技术进行一系列突击测验——当客户抛出难题时能否保持对话流畅?能否适应不同性格和说话风格?

早期测试已识别出三种表现最佳的模型,尽管团队尚未公布具体排名。这些结果为考虑采用AI呼叫解决方案的企业(从科技初创公司到北京三快科技等成熟企业)提供了宝贵指导。

当下意义何在

随着更多企业采用AI呼叫技术,建立可靠的性能标准变得至关重要。被机械式交互激怒的客户可能会挂断电话,而流畅的对话则能建立信任和满意度。VoiceAgentEval旨在推动整个行业实现更自然、高效的沟通。

基准测试创建者希望它能加速开发不仅遵循脚本、更能理解并响应人类需求的AI——让那些自动通话感觉不像在与机器交谈,而更像与贴心助手聊天。

关键要点:

  • 首个评估AI外呼的行业标准
  • 测试真实商业场景而非实验室条件
  • 同时评估文本逻辑与语音质量
  • 包含150组模拟对话情境
  • 初步测试已识别出表现最佳的模型

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

谷歌WAXAL项目助力非洲语言在AI领域发声

谷歌发布了突破性的WAXAL语音数据集,涵盖21种非洲语言。与以往由科技巨头主导的举措不同,非洲机构保留了对这一资源的所有权。凭借超过11,000小时的录音资料,WAXAL旨在解决长期存在的识别问题,同时赋能本地AI发展。多所大学已将其应用于从孕产保健到语言保护等多个项目。

February 12, 2026
AI多样性语音技术非洲创新
News

ElevenLabs完成5亿美元巨额融资后估值飙升至110亿美元

语音AI先驱ElevenLabs已成功获得惊人的5亿美元新融资,使其估值飙升至110亿美元——较一年前增长了三倍。红杉资本领投本轮融资,现有支持者大幅增加了持股比例。该公司年经常性收入已达3.3亿美元,计划在全球范围内扩张业务,并从语音技术向能处理文本、视频并执行操作的多模态AI代理转型。

February 5, 2026
人工智能语音技术初创企业融资
News

搜狗输入法AI用户突破1亿,语音识别接近完美

腾讯旗下搜狗输入法迎来重大里程碑,其AI功能用户数已突破1亿。最新版本具备98%的语音识别准确率,每日处理的语音请求量高达20亿次。除技术升级外,此次更新还带来更智能的预测输入和更简洁的界面——证明AI甚至能让我们的键盘变得更实用。

January 27, 2026
AI助手语音技术腾讯产品
Qwen的AI餐饮助手:那些令人信服的通话背后无需人类参与
News

Qwen的AI餐饮助手:那些令人信服的通话背后无需人类参与

Qwen针对其餐厅预订AI由真人驱动的猜测作出回应。该公司透露其助手采用先进的情感识别技术,提供极具人性化的通话服务。该系统能在0.1秒内检测50多种情绪,并生成时机完美的回复。虽然有人质疑为何AI需要保持'工作时间',Qwen解释这实际上通过匹配餐厅营业时间提高了预订成功率。即将推出?个性化语音和多语言支持将助力全球餐饮预订。

January 26, 2026
AI助手语音技术Qwen
News

LiveKit跻身独角兽俱乐部,1亿美元融资助推AI语音革命

实时音视频基础设施提供商LiveKit近日完成1亿美元B轮融资,估值达10亿美元。该公司为OpenAI的ChatGPT语音功能提供技术支持,其快速增长反映了市场对无缝AI交互技术的旺盛需求,客户涵盖特斯拉到紧急服务部门。这家创立于疫情期间视频通话热潮的企业,如今已成为对话式AI革命的核心力量。

January 23, 2026
AI基础设施语音技术初创企业融资
News

班加罗尔AI初创公司Bolna融资630万美元,旨在革新多语言通话

总部位于班加罗尔的Bolna已获得由General Catalyst领投的630万美元种子轮融资,Y Combinator和Blume Ventures参与投资。这家语音AI初创公司专注于企业多语言智能通话,自2025年5月推出以来实现了爆发式增长——从每日1,500通电话激增至超过20万通。随着团队扩张和方言技术提升的计划,Bolna目标在2026年中期实现500万美元的年收入。

January 21, 2026
AI初创公司语音技术商业自动化