跳转到主要内容

字节跳动Seeduplex让AI实现类人听说能力

字节跳动推出革命性类人语音AI

想象与一个只会沉默倾听、待你完全停止说话才回应的人交谈——这就是当前多数语音助手的工作方式。字节跳动Seed团队在4月9日发布的Seeduplex改变了这一现状,为AI交互带来了真正的对话流。

Image

终结机械式轮流应答

Seeduplex从根本上改变了当前语音助手'对讲机'式交互模式。传统系统采用半双工技术——要么收听要么发声,无法同时进行。这导致了我们都经历过的尴尬停顿。

"我们想重现人类对话的自然节奏,"一位参与该项目的字节跳动工程师解释,"人们交谈时,我们会持续处理语音,甚至在组织回应的同时捕捉细微变化。"

该模型通过创新的同步处理框架实现:

  • 较现有方案减少50%的误应答
  • 支持多人场景下的重叠语音处理
  • 可过滤交通声、电视音等背景噪音

超越普通助手的智能

Seeduplex的突出之处不仅在于技术参数,更在于其对对话语境的理解:

  1. 动态终止技术将响应延迟缩短250毫秒(约人类眨眼时长),同时减少40%意外打断。AI现在能区分思考停顿与说话结束。

  2. 测试中发现有趣现象:随着交互更自然,用户会无意识地调整说话方式。"因为感到被倾听,人们开始减少打断AI的行为,"工程师指出。

  3. 后台采用推测性采样等优化,确保系统在抖音数千万用户的高峰使用期仍保持响应——该技术已部署于此平台。

AI伴侣的未来图景

Seeduplex不仅关乎更好的语音技术,更是通向真正智能助手的基石。字节跳动暗示很快将结合视觉识别,打造不仅能听会说、还能像人类一样观察理解场景的AI。

这是否意味着科幻中的多模态助手时代来临?团队愿景给出了肯定答案:"我们正朝能听、会看、懂思考并恰当回应的系统迈进——那时AI将不再像工具,而开始像伙伴。"

核心要点:

  • Seeduplex实现人类般的语音同步处理,消除尴尬停顿
  • 已上线抖音,每日处理数百万次对话
  • 较当前语音助手错误率降低50%
  • 响应速度提升250毫秒,停顿检测更精准
  • 为融合语音、视觉与语境理解的AI铺路

项目页面:https://seed.bytedance.com/seeduplex

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

Google DeepMind CEO 揭示初创企业式战略以重夺AI领导地位

Google DeepMind CEO Demis Hassabis 透露公司正采用初创企业般的敏捷性来重获AI创新前沿地位。通过打破内部壁垒和整合计算资源,DeepMind在短短2-3年内从追随者转变为领导者。Hassabis声称90%的基础AI突破现在来自谷歌关联实验室,这种新架构帮助他们更好地与OpenAI等对手竞争。

April 9, 2026
AI创新Google DeepMind科技初创企业
腾讯QBotClaw将你的浏览器变身为智能助手
News

腾讯QBotClaw将你的浏览器变身为智能助手

腾讯发布了内置于QQ浏览器的革命性AI智能体QBotClaw,这项创新技术彻底改变了人机交互方式。用户通过简单的语音或文字指令(甚至能通过微信远程操作)即可控制浏览器。凭借屏幕内容理解与自主任务执行等特性,QBotClaw势将为普通用户和专业人士带来生产力革命。

April 9, 2026
AI创新腾讯浏览器技术
News

贝佐斯借秘密项目'普罗米修斯'大举押注工业AI

杰夫·贝佐斯正以其隐秘的'普罗米修斯项目'在AI领域掀起波澜,该项目旨在将人工智能与物理世界连接起来。该计划近期从OpenAI的xAI部门挖走了顶尖人才,并采取技术创新与大规模资本部署的双重战略。与专注于文本的AI系统不同,普罗米修斯致力于开发理解物理定律的模型,可能通过专业数据训练和前所未有的资金投入彻底改变重工业。

April 9, 2026
人工智能杰夫·贝佐斯工业科技
小米OmniVoice:多语言语音合成的颠覆者
News

小米OmniVoice:多语言语音合成的颠覆者

小米新一代Kaldi团队开源了突破性的多语言文本转语音模型OmniVoice,支持600多种语言。其中文词错率低至0.84%,处理速度比实时快40倍,为语音合成树立了新标准。更令人惊叹的是,它仅需3-10秒音频即可克隆声音,甚至能帮助保护濒危语言。

April 9, 2026
语音合成AI创新多语言技术
别克全新E7配备能理解你的AI伙伴
News

别克全新E7配备能理解你的AI伙伴

别克愿景E7引入了由豆包AI模型驱动的突破性智能座舱。这并非普通的语音助手——它能识别情绪、记忆上下文,感觉更像数字伙伴而非机器。在为人车交互带来类人体验的同时,工程师实施了严格的安全措施,确保先进AI绝不会影响车辆安全。这标志着从指令系统到真正理解型汽车AI的重大飞跃。

April 8, 2026
汽车AI智能座舱豆包模型
News

迪士尼机器人专家与Midjourney联合创始人推出情感生物机器人

一位前迪士尼幻想工程工程师与Midjourney联合创始人合作创造了Éloi——一款逼真到模糊机器与伴侣界限的生物机器人。凭借模块化DIY功能、情感响应和受迪士尼启发的'呼吸'技术,这项创新可能重新定义我们与AI的互动方式。该项目将迪士尼的叙事魔法与尖端机器人技术相结合,或许打造出了迄今为止最具情感智能的机器人。

April 7, 2026
机器人技术人工智能人机交互