跳转到主要内容

Meta的SAM Audio技术:一键实现声音分离

Meta用SAM Audio革新音频编辑技术

想象一下,只需点击音乐会视频中的乐手就能提取吉他独奏,或输入"狗叫"就能从喜欢的播客中过滤犬吠声。这不是科幻小说——这正是Meta新推出的SAM Audio技术创造的现实。

SAM Audio工作原理 其核心是名为「感知编码视听系统」(PE-AV)的技术,Meta称之为模型的"耳朵"。这项巧妙的技术以前所未有的方式将视觉理解与音频处理相结合,相当于赋予AI人类在嘈杂环境中聚焦特定声音的自然能力。

三种控制音频的方式 SAM Audio的真正特别之处在于其直观的操作方式:

  • 语音指令:输入"人声演唱"或"汽车鸣笛"等短语,系统就会神奇地提取这些声音
  • 点击聆听:点击视频中的物体或人物即可分离相关音频
  • 标记时段:高亮时间片段(如3:12至3:18)可消除该时段的噪音——就像音频版的Photoshop

Meta将部分功能比作《赛博朋克2077》等游戏中才有的技术。但与未来幻想不同,这项技术现已真实可用。

技术开源计划 为加速行业音频创新,Meta发布了两项重要工具:

  • SAM Audio-Bench:音频分离技术的真实测试平台
  • SAM Audio Judge:自动质量检测器,评估声音分离的纯净度

潜在应用场景令人惊叹——从使会议录音清晰可辨,到创建可自主控制听觉的AR沉浸体验,甚至可能改善听障人士的辅助设备。

随着视频内容持续爆发式增长,SAM Audio代表着我们与声音交互方式的根本转变。从被动接听到主动控制音频——这可能只是AI改变我们感官体验的开端。

核心亮点:

  • 点击式声音分离让音频编辑大众化
  • 视觉与听觉处理结合获得更精确结果
  • 开源工具旨在标准化音频分离技术
  • 应用范围涵盖娱乐科技到辅助设备

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

Meta智能眼镜被曝向海外传输私密视频

瑞典调查显示,Meta与雷朋合作的AI智能眼镜正秘密将用户的私人视频——包括浴室画面和亲密时刻——发送至肯尼亚的人工审核员手中。尽管声称具备自动人脸模糊功能,但工作人员报告该功能频繁失效导致身份暴露。这起丑闻已引发多起诉讼,指控其侵犯隐私和虚假宣传。

March 6, 2026
Meta隐私丑闻可穿戴技术
News

Meta豪赌定制AI芯片以摆脱科技巨头依赖

Meta正加倍投入芯片制造雄心,旨在减少对英伟达和AMD的依赖。首席财务官Susan Li透露计划开发能够处理复杂AI训练任务的定制处理器。在继续与芯片制造商合作的同时,Meta寻求通过混合现成与定制解决方案的策略来掌控自身计算未来。

March 5, 2026
MetaAI芯片半导体
谷歌Gemini 3.1 Flash-Lite:更快、更智能,但价格更高
News

谷歌Gemini 3.1 Flash-Lite:更快、更智能,但价格更高

Google DeepMind发布Gemini 3.1 Flash-Lite,与前代相比在速度和智能上均有显著提升。该模型每秒可处理超过360个token且响应迅速,尤其在科学推理等复杂任务中表现突出。但这些改进伴随着成本上升——定价近乎翻了三倍,标志着AI市场正转向高性能溢价路线。

March 4, 2026
AI开发Google DeepMind机器学习
AI智能体通过新型训练框架实现实时进化
News

AI智能体通过新型训练框架实现实时进化

蚂蚁集团与清华大学联合发布AReaL v1.0强化学习框架,这项突破性技术让AI智能体在实际使用中持续自我提升。与传统需要大量编码的系统不同,该创新方案能让现有智能体无缝连接——想象你的数字助手每次使用时都在变得更聪明。系统的秘密武器?一个AI驱动的开发助手在创纪录时间内帮助构建了其复杂架构。

March 4, 2026
AI机器学习科技创新
DeepSeek V4 Lite:掀起波澜的紧凑型AI模型
News

DeepSeek V4 Lite:掀起波澜的紧凑型AI模型

DeepSeek V4 Lite 是一款仅含2000亿参数却异常强大的AI模型,正在科技界引发广泛关注。这款最初于二月发布、具备出色长文本处理能力的模型,经过近期更新后性能显著提升。开发者报告称,其目前在逻辑推理、编程和美学方面已可媲美Anthropic Claude 3.5 Sonnet等国际顶级模型。这一意外突破让人们对完整版可能达到的高度充满期待。

March 3, 2026
人工智能机器学习DeepSeek
News

Meta测试了解你风格的AI购物助手

Meta正在低调测试一项基于AI的全新购物功能,该功能利用其庞大的社交数据宝库提供个性化推荐。该工具通过分析位置、浏览历史甚至推测性别,为每位用户量身推荐商品。虽然仍处于早期阶段,此举表明了Meta欲与谷歌和OpenAI在AI商务领域竞争的雄心。

March 3, 2026
AI商务Meta个性化购物