跳转到主要内容

谷歌Gemini遭围攻:黑客通过持续提问窃取AI机密

谷歌应对针对Gemini AI的大规模攻击

Image

在被安全专家称为对人工智能系统史无前例的袭击中,谷歌本周披露其Gemini聊天机器人遭受了旨在提取核心算法的持续提问攻击。攻击者向系统发送精心设计的提示——有时单次攻击就超过10万次查询——试图逆向工程分析AI的思考方式。

AI窃密手法解析

这种被称为"模型蒸馏"的技术,其原理类似于通过反复访谈来理解某人的决策过程。通过分析Gemini对数千个相似问题变体的响应模式,攻击者可以拼凑出驱动AI的底层逻辑。

"这不仅仅是好奇心——而是商业间谍行为,"谷歌首席威胁分析师John Hottelquist表示,"我们看到资金充足的组织在系统性探测我们的系统,试图窃取价值数十亿美元的研究成果。"

谁是幕后黑手?

虽然谷歌没有点名具体责任方,但有证据指向希望在人工智能竞赛中走捷径的竞争AI公司和研究机构。攻击源自全球多个地点,表明这是协调行动而非孤立事件。

利害关系极为重大。像Gemini这样的大型语言模型代表着科技公司最有价值的资产——是计算能力和人类专业知识巨额投入的产物。它们的内部机制构成了堪比可口可乐秘方的商业机密。

给所有企业的警钟

Hottelquist将谷歌的经历描述为AI安全领域的"煤矿中的金丝雀"。随着更多企业开发包含专有数据和流程的定制AI工具,它们都可能成为类似提取尝试的目标。

这些攻击暴露了当今AI领域的一个根本矛盾:这些强大工具需要广泛可访问性才能发挥作用,但同样的开放性也使它们变得脆弱。现有的防护措施可以检测和阻止许多提取尝试,但愿意投入时间和资源的坚定攻击者往往能找到规避方法。

未来影响展望

这一事件引发了关于如何在AI领域平衡创新与保护的难题:

  • 企业如何在保持产品可访问性的同时保护投资?
  • 是否应该对模型蒸馏尝试追究法律责任?
  • 这会加速向更封闭的AI系统转变吗?

有一点似乎可以确定:随着人工智能在全球商业运营中变得越来越核心,保护这些系统只会变得更加关键——也更具挑战性。

关键要点:

  • 规模:针对Gemini核心逻辑的攻击涉及超过10万条提示
  • 动机:商业竞争对手寻求专有AI算法
  • 风险:可能窃取多年研发投资成果
  • 更广泛影响:标志着所有使用定制AI的企业面临的新兴威胁

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

OpenAI加强ChatGPT安全防护,抵御隐蔽提示攻击
News

OpenAI加强ChatGPT安全防护,抵御隐蔽提示攻击

OpenAI为ChatGPT推出两项智能安全升级,以应对提示注入攻击——这类狡猾手段可操纵AI执行有害操作。新的'封锁模式'限制敏感行业的高风险外部交互,而'高风险'标签则清晰标记潜在危险功能。随着AI互联程度加深,这些措施在现有保护机制上进一步强化。

February 14, 2026
AI安全ChatGPTOpenAI更新
News

OpenAI战略调整:解散对齐团队,负责人转任未来学家角色

OpenAI在一次出人意料的组织变革中解散了其使命对齐团队。前团队负责人Josh Achiam转任新设立的首席未来学家职位,其余成员则分散到其他部门。这是自2024年以来OpenAI以安全为重点的团队第二次重大重组,标志着该公司在发展过程中优先事项的演变。

February 12, 2026
OpenAIAI安全人工智能
OpenAI再次调整安全团队架构,设立‘首席未来学家’新职位
News

OpenAI再次调整安全团队架构,设立‘首席未来学家’新职位

OpenAI在成立不到两年后解散了其‘使命对齐’安全团队,这是其安全基础设施的第二次重大重组。此举标志着该公司将安全考量嵌入各部门而非保持独立监督的转变。与此同时,前团队负责人Josh Achiam转任新设立的‘首席未来学家’职位,专注于长期通用人工智能(AGI)的影响研究。

February 12, 2026
OpenAIAI安全人工智能
News

微软警告:被‘下毒’的分享按钮可能污染AI记忆

微软安全专家发现了一种针对AI系统的隐秘网络威胁。黑客将恶意代码隐藏在看似无害的分享按钮中,诱使AI记住并传播带有偏见或错误的信息。这些‘有毒’提示会长期存在于AI记忆中,潜移默化地影响后续回答。此类攻击横跨多个行业且技术门槛极低。微软建议用户谨慎点击AI生成链接,并定期清理助手记忆。

February 12, 2026
AI安全网络安全Microsoft Defender
News

Claude插件曝重大安全漏洞:日历邀请可触发关键威胁

Claude桌面扩展新发现的漏洞允许黑客通过看似无害的Google日历邀请远程执行恶意代码。安全研究人员警告这种'零点击'攻击可能造成毁灭性后果,在CVSS风险评分中获得满分10分。尽管Anthropic将责任推给用户,专家认为该插件系统未能满足基本安全预期。

February 11, 2026
AI安全Claude漏洞零点击攻击
OpenClaw框架遭重大恶意软件攻击
News

OpenClaw框架遭重大恶意软件攻击

OpenClaw AI框架在一次复杂的供应链攻击中遭到入侵,其扩展平台被上传了数百个恶意'技能'。网络安全专家警告这些被植入木马的工具可能窃取毫无戒心的用户的敏感数据。该公司已与VirusTotal合作实施紧急安全措施,包括对所有可用技能进行每日AI驱动的扫描。

February 9, 2026
网络安全AI安全恶意软件