跳转到主要内容

Meta的SAM Audio技术:一键实现声音分离

Meta用SAM Audio革新音频编辑技术

想象一下,只需点击音乐会视频中的乐手就能提取吉他独奏,或输入"狗叫"就能从喜欢的播客中过滤犬吠声。这不是科幻小说——这正是Meta新推出的SAM Audio技术创造的现实。

SAM Audio工作原理 其核心是名为「感知编码视听系统」(PE-AV)的技术,Meta称之为模型的"耳朵"。这项巧妙的技术以前所未有的方式将视觉理解与音频处理相结合,相当于赋予AI人类在嘈杂环境中聚焦特定声音的自然能力。

三种控制音频的方式 SAM Audio的真正特别之处在于其直观的操作方式:

  • 语音指令:输入"人声演唱"或"汽车鸣笛"等短语,系统就会神奇地提取这些声音
  • 点击聆听:点击视频中的物体或人物即可分离相关音频
  • 标记时段:高亮时间片段(如3:12至3:18)可消除该时段的噪音——就像音频版的Photoshop

Meta将部分功能比作《赛博朋克2077》等游戏中才有的技术。但与未来幻想不同,这项技术现已真实可用。

技术开源计划 为加速行业音频创新,Meta发布了两项重要工具:

  • SAM Audio-Bench:音频分离技术的真实测试平台
  • SAM Audio Judge:自动质量检测器,评估声音分离的纯净度

潜在应用场景令人惊叹——从使会议录音清晰可辨,到创建可自主控制听觉的AR沉浸体验,甚至可能改善听障人士的辅助设备。

随着视频内容持续爆发式增长,SAM Audio代表着我们与声音交互方式的根本转变。从被动接听到主动控制音频——这可能只是AI改变我们感官体验的开端。

核心亮点:

  • 点击式声音分离让音频编辑大众化
  • 视觉与听觉处理结合获得更精确结果
  • 开源工具旨在标准化音频分离技术
  • 应用范围涵盖娱乐科技到辅助设备

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

Meta的能源布局:扎克伯格豪赌能源基础设施以争夺AI霸主地位
News

Meta的能源布局:扎克伯格豪赌能源基础设施以争夺AI霸主地位

Meta首席执行官马克·扎克伯格正采取大胆举措以确保公司在AI领域的未来——通过自建电网。'Meta Compute'计划旨在建设千兆瓦级能源设施,试图掌控被扎克伯格视为AI最关键资源的能源。随着预测显示美国AI电力需求将激增十倍,Meta正在组建一支梦之团队,将电力转化为其终极竞争优势。

January 13, 2026
MetaArtificialIntelligenceEnergyInfrastructure
DeepSeek-V4将于今年二月彻底革新代码生成领域
News

DeepSeek-V4将于今年二月彻底革新代码生成领域

DeepSeek正筹备在农历新年期间推出其强大的新型AI模型DeepSeek-V4。此次更新将在代码生成和处理复杂编程任务方面实现重大突破,有望超越Claude和GPT系列等竞争对手。开发者可以期待这款创新工具提供更有条理的响应和更强的推理能力。

January 12, 2026
AI发展编程工具机器学习
News

Meta Llama 4丑闻:AI野心如何导致道德失范

Meta曾备受赞誉的Llama AI项目陷入动荡,有关操纵基准数据的真相浮出水面。前首席科学家Yann LeCun证实存在道德违规行为,暴露出内部冲突及扎克伯格施加的仓促开发压力。这起丑闻对Meta的AI战略及其在快速发展的人工智能领域保持道德竞争的能力提出了严峻质疑。

January 12, 2026
MetaAI伦理科技丑闻
中国研究人员教会AI在图像生成中自我纠错
News

中国研究人员教会AI在图像生成中自我纠错

中国高校取得突破性进展,解决了AI的'视觉读写障碍'——图像系统能理解概念却难以正确呈现的问题。他们的UniCorn框架如同内部质检团队,能在创作过程中捕捉并修正错误。早期测试显示其在空间准确性和细节处理方面有显著提升。

January 12, 2026
AI创新计算机视觉机器学习
Meta的Spatial Lingo将你的客厅变成语言教室
News

Meta的Spatial Lingo将你的客厅变成语言教室

Meta发布了创新的开源Unity应用Spatial Lingo,它能将日常物品转化为语言学习工具。这款应用通过混合现实技术,引导用户利用周围环境中的物品进行词汇练习。开发者可以通过实际案例探索Meta的SDK,同时创造引人入胜的教育体验。该项目展示了AR如何让语言学习更具沉浸感和情境相关性。

January 8, 2026
增强现实语言学习Meta
News

Meta智能眼镜遭遇瓶颈:订单积压至2026年

Meta与Ray-Ban合作的智能眼镜意外走红,需求高涨导致国际发布推迟至2026年年中。这款由EssilorLuxottica参与开发的科技眼镜融合时尚与AI功能,支持免提信息显示和语音交互。由于美国订单已排至数年之后,Meta正全力提升产能以应对全球扩张计划。

January 7, 2026
MetaSmartGlassesTechShortage