ElevenLabs CEO:AI语音模型即将进入商品化时代
ElevenLabs CEO预言AI语音模型将商品化
在TechCrunch Disrupt 2025大会上,ElevenLabs联合创始人兼CEO Mati Staniszewski做出大胆预测:AI语音模型将在未来两到三年内实现商品化。尽管目前仍是竞争差异点,但Staniszewski认为主流语言和通用语音风格的模型性能差距将显著缩小。

图片来源说明:该图片由AI生成,授权服务商为Midjourney
短期聚焦模型 长期布局产品
当被问及为何在可能同质化的未来模型上重金投入研发时,Staniszewski解释道:“现阶段模型仍是最大技术壁垒。如果AI语音听起来不自然或不流畅,用户体验就会受损。”他特别指出ElevenLabs在模型架构上的突破——尤其是情感表达和多语言韵律建模——是当前的关键优势。
公司已开始为后模型时代做准备。“我们的长期战略不仅是成为模型供应商,”Staniszewski强调,“我们正在构建完整的‘AI+产品’体验。”借鉴苹果智能手机的软硬件集成思路,ElevenLabs计划用自有模型作为引擎驱动高价值应用场景。
多模态融合成新战场
展望未来1-2年,Staniszewski预见单模态语音系统将快速向多模态平台演进。“用户将能同步生成音频和视频,”他预测道,“或在对话过程中动态连接大语言模型与语音引擎。”他以谷歌Veo3视频生成模型为例,指出跨模态协作代表着下一技术前沿。
为抢占先机,ElevenLabs正积极寻求与第三方模型及开源社区合作。这些协作旨在将其音频能力嵌入更广阔的AI生态——可能催生沉浸式虚拟人类、高级智能客服系统或创新互动娱乐体验。
商品化预示价值转移而非衰退
Staniszewski驳斥了“模型商品化即行业衰退”的观点,认为这实则是价值创造从底层技术向应用创新的转移。“未来企业会根据具体场景选择模型,”他解释道,“客服解决方案、游戏配音和教育讲解将采用不同技术方案。”
这位CEO指出可靠性、扩展性和场景适配性将超越原始音质成为核心决策因素。为此,ElevenLabs正加强其API平台、开发者工具链和行业定制方案——确保客户能将高质量语音无缝集成至业务流程中。
核心要点:
- 商品化时间表:预计AI语音模型将在2-3年内成为标准化商品
- 战略转型:ElevenLabs正从纯模型开发转向集成化产品解决方案
- 多模态未来:音频与视频生成及LLMs的融合将成为新竞争焦点
- 价值迁移:行业重点正从技术优势转向场景化落地能力
