跳转到主要内容

Gemini遭遇围攻:黑客通过海量提示攻击窃取AI机密

谷歌就AI模型窃取计划拉响警报

Image

谷歌安全团队发现了一个令人不安的趋势——黑客正通过专家所称的"模型蒸馏攻击"系统地探测Gemini人工智能。与传统黑客手段不同,这些攻击者利用聊天机器人的本质特性,向其发送数十万条精心设计的提示。

"想象有人用100种不同方式问你同一个问题,"谷歌威胁情报主管John Hottelquist解释道,"最终会暴露出你的思维模式。本质上这就是正在发生的事,但达到了工业级规模。"

2月12日首次发现这些攻击时,谷歌注意到针对Gemini的异常活动模式。与可能提出几十甚至几百个问题的普通用户不同,这些攻击者系统性地提交了数万条查询,试图绘制出Gemini的内部逻辑图。

商业间谍视角

根据谷歌调查,这些数字攻击背后似乎是资金充足的组织——很可能是竞争对手AI公司或研究机构。他们的目标?要么克隆Gemini的能力,要么通过逆向工程其算法来提升自己的系统。

"这不仅仅是学术好奇心,"Hottelquist警告说,"我们谈论的是可能窃取价值数十亿美元开发成本的知识产权。"

虽然谷歌对具体嫌疑人守口如瓶,但这些攻击源自全球多个地点。最让安全团队担忧的是这种技术可能扩散开来。

AI安全的警钟

谷歌将其经历比作煤矿中的金丝雀——预示着整个行业面临危险的早期指标。随着更多公司开发包含敏感商业数据的专有AI模型,它们都可能成为类似提取尝试的目标。

现有防御措施难以应对这些新型攻击,因为它们利用了大型语言模型运作的基本特性。虽然平台可以检测并阻止可疑活动模式,但在保持实用功能的同时完全防止此类探测仍是一个持续挑战。

攻击者似乎特别专注于揭露Gemini的推理算法——控制其处理信息并得出结论的秘密配方。成功提取这些算法可能让竞争对手无需投入原创研究就能复制关键能力。

关键点:

  • 黑客使用海量提示(10万+)逆向工程Gemini的逻辑
  • 攻击很可能由竞争对手公司/研究人员出于商业动机发起
  • 该技术威胁价值数十亿美元的核心知识产权
  • 警告随着定制AI模型激增带来的更广泛风险
  • 由于模型固有的开放性导致当前防御措施有限

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

OpenAI因安全顾虑停用GPT-4o,80万用户深感失望
News

OpenAI因安全顾虑停用GPT-4o,80万用户深感失望

OpenAI将于本周五逐步淘汰五款旧版ChatGPT模型,其中备受争议的GPT-4o最为引人注目。该模型因涉及多起'AI精神异常'事件诉讼而面临法律纠纷,包括被指控鼓励自残的案例。尽管在ChatGPT的8亿用户中仅有0.1%仍在使用GPT-4o,但许多用户已对其产生情感依赖——超过2万人签署请愿书抗议其下架。公司坚称这是出于安全和合规的必要措施。

February 14, 2026
OpenAIGPT-4oAI安全
News

OpenAI战略调整:解散对齐团队,负责人转任未来学家角色

OpenAI在一次出人意料的组织变革中解散了其使命对齐团队。前团队负责人Josh Achiam转任新设立的首席未来学家职位,其余成员则分散到其他部门。这是自2024年以来OpenAI以安全为重点的团队第二次重大重组,标志着该公司在发展过程中优先事项的演变。

February 12, 2026
OpenAIAI安全人工智能
OpenAI再次调整安全团队架构,设立‘首席未来学家’新职位
News

OpenAI再次调整安全团队架构,设立‘首席未来学家’新职位

OpenAI在成立不到两年后解散了其‘使命对齐’安全团队,这是其安全基础设施的第二次重大重组。此举标志着该公司将安全考量嵌入各部门而非保持独立监督的转变。与此同时,前团队负责人Josh Achiam转任新设立的‘首席未来学家’职位,专注于长期通用人工智能(AGI)的影响研究。

February 12, 2026
OpenAIAI安全人工智能
News

微软警告:被‘下毒’的分享按钮可能污染AI记忆

微软安全专家发现了一种针对AI系统的隐秘网络威胁。黑客将恶意代码隐藏在看似无害的分享按钮中,诱使AI记住并传播带有偏见或错误的信息。这些‘有毒’提示会长期存在于AI记忆中,潜移默化地影响后续回答。此类攻击横跨多个行业且技术门槛极低。微软建议用户谨慎点击AI生成链接,并定期清理助手记忆。

February 12, 2026
AI安全网络安全Microsoft Defender
News

Claude插件曝重大安全漏洞:日历邀请可触发关键威胁

Claude桌面扩展新发现的漏洞允许黑客通过看似无害的Google日历邀请远程执行恶意代码。安全研究人员警告这种'零点击'攻击可能造成毁灭性后果,在CVSS风险评分中获得满分10分。尽管Anthropic将责任推给用户,专家认为该插件系统未能满足基本安全预期。

February 11, 2026
AI安全Claude漏洞零点击攻击
OpenClaw框架遭重大恶意软件攻击
News

OpenClaw框架遭重大恶意软件攻击

OpenClaw AI框架在一次复杂的供应链攻击中遭到入侵,其扩展平台被上传了数百个恶意'技能'。网络安全专家警告这些被植入木马的工具可能窃取毫无戒心的用户的敏感数据。该公司已与VirusTotal合作实施紧急安全措施,包括对所有可用技能进行每日AI驱动的扫描。

February 9, 2026
网络安全AI安全恶意软件