跳转到主要内容

OpenAI 推迟发布 AI 代理,因安全问题担忧

OpenAI,作为人工智能发展的领军者,由于担心 '提示注入' 攻击,推迟了其备受期待的 AI 代理发布。尽管 MicrosoftAnthropic 等公司已经推出了自己的 AI 代理,OpenAI 仍专注于提升安全性,以避免这些攻击带来的风险。

什么是 '提示注入' 攻击?

'提示注入' 攻击发生在恶意行为者操控 AI 模型接受有害指令时。这可能导致意外后果,例如 AI 代理访问危险网站、忘记指令,甚至泄露敏感个人信息。在极端情况下,攻击者可能利用 AI 访问私人数据,包括电子邮件或信用卡信息。

AI 自主性带来的风险增加

AI 代理能够自主与环境互动并执行任务,无需人工输入,这带来了重大的安全挑战。由于 AI 代理能够控制计算机并访问敏感数据,它们正日益成为网络攻击的目标。一位 OpenAI 员工强调,尽管像 ChatGPT 这样的语言模型天生容易受到攻击,但 AI 代理的 自主能力 使得这些风险更加严重。

AI 系统中的先前安全问题

提示注入 风险并非理论上的问题。去年,一位安全研究人员演示了如何操控 Microsoft's Copilot AI 泄露敏感的组织数据,包括电子邮件和财务记录。此外,研究人员还成功让 Copilot AI 以其他员工的风格撰写电子邮件,进一步暴露了系统的漏洞。

OpenAI 自己的 ChatGPT 也遇到了类似的安全问题。一位研究人员通过上传第三方文件,如 Word 文档,成功向系统注入虚假的 '记忆'。这些攻击类型突显了 OpenAI 在完善其 AI 代理的安全措施时所面临的漏洞。

OpenAI 对风险的回应

在 OpenAI 努力解决这些安全问题时,公司的做法让人惊讶,尤其是与 Anthropic 的处理方式相比。Anthropic,另一家 AI 开发公司,采取了相对放任的方式,仅建议开发者将 AI 代理与敏感数据隔离。相比之下,OpenAI 采取了更为谨慎的态度,强调严格的安全措施,以确保其 AI 代理的安全使用。

报告显示,OpenAI 可能在本月稍晚时推出其 AI 代理。然而,发布的时间表引发了关于公司是否能实施足够的安全防护来防范潜在攻击的疑问。

Image

关键点

  1. OpenAI 因担心 '提示注入' 攻击可能危及用户数据,已推迟发布其 AI 代理。
  2. MicrosoftAnthropic 等公司已经发布了 AI 代理,但安全漏洞仍然是一个重大问题。
  3. OpenAI 正在努力加强其安全措施,以应对这些风险,旨在防止潜在的数据泄露。

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

《大英百科全书》起诉OpenAI涉嫌内容侵权

历史悠久的《大英百科全书》已对OpenAI提起诉讼,指控这家AI巨头未经许可使用其受版权保护的材料来训练ChatGPT。这一法律行动凸显了传统知识提供商与AI公司在内容使用方面日益紧张的关系。大英百科全书声称OpenAI复制了近10万篇文章和定义,同时对其错误地将信息归因于该百科全书的倾向表示担忧。此案可能为AI公司在训练过程中如何使用受版权保护的材料树立重要先例。

March 20, 2026
AI版权OpenAI大英百科全书
News

OpenAI上诉获胜:意大利法院撤销1500万欧元隐私罚款

在一场重要的法律胜利中,OpenAI成功上诉了意大利监管机构因ChatGPT数据实践而开出的1500万欧元罚单。罗马法院的这一裁决缓解了这家AI开发商的财务压力,同时也引发了关于如何在欧洲平衡创新与隐私保护的新问题。虽然完整判决理由尚未公开,但此次逆转可能影响全球范围内正在进行的AI监管辩论。

March 20, 2026
OpenAIAI监管隐私法
微软MAI-Image-2跻身全球AI图像生成三强
News

微软MAI-Image-2跻身全球AI图像生成三强

微软发布全新强力MAI-Image-2模型,现位列全球文本转图像AI系统前三甲。这项突破性技术解决了AI生成图像中文字乱码的长期问题,同时提供惊艳的视觉质量。用户已可免费测试该模型,微软计划很快将其整合至生产力工具中。

March 20, 2026
AIMicrosoftimage-generation
Anthropic旗下Claude Code进军移动端:用手机掌控AI开发
News

Anthropic旗下Claude Code进军移动端:用手机掌控AI开发

Anthropic悄然推出了一项改变游戏规则的开发者功能——Claude Code Channels。现在您可以通过Telegram或Discord远程管理本地AI编程会话,随时随地接收更新并发送指令。该功能将Claude Code转变为真正的异步开发助手,让您离开办公桌时它仍能持续工作。早期使用者已将其比作与人类工程师协作的体验。

March 20, 2026
AI开发Anthropic远程编程
News

OpenAI收购Astral以增强其编程助手Codex

OpenAI已收购开发者工具初创公司Astral,这标志着其在人工智能编程领域激烈竞争中的最新举措。该交易于3月19日宣布,Astral团队将加入OpenAI以增强Codex编程助手。虽然财务细节未披露,但此次收购表明OpenAI正积极保持其在蓬勃发展的AI编程领域对Anthropic和Cursor等竞争对手的领先优势。这波收购潮中,OpenAI已拓展至硬件、安全和医疗等多个领域。

March 20, 2026
OpenAI人工智能编程Codex
OpenAI通过战略收购Astral强化Codex实力
News

OpenAI通过战略收购Astral强化Codex实力

OpenAI再出战略举措,收购了以流行Python工具Ruff和uv闻名的开发者工具初创公司Astral。此次收购旨在加强OpenAI的编程助手Codex,该产品今年用户数量已增长两倍。这是OpenAI在多个科技领域进行一系列高调收购的广泛扩张战略的一部分。

March 20, 2026
OpenAI人工智能开发科技并购