跳转到主要内容

OpenAI加强ChatGPT安全防护,抵御隐蔽提示攻击

OpenAI强化ChatGPT防御机制应对人为操控

Image

ChatGPT刚刚增强了抵御数字欺骗的能力。OpenAI宣布了重大安全升级,旨在阻止提示注入攻击——随着AI系统与网站和外部应用更深层次整合,这已成为日益严峻的问题。

敏感交互的锁定模式

最突出的功能是锁定模式,这是一个可选设置,目前面向企业、教育、医疗和教师版本开放。可以将其视为ChatGPT在处理敏感数据时的'离线模式'。

"这不是普通的安防开关,"OpenAI在公告中解释,"锁定模式从根本上改变了ChatGPT与外界交互的方式。"

该模式通过以下方式工作:

  • 将网页浏览限制在缓存内容范围内
  • 禁用缺乏可靠安全保障的功能
  • 为管理员提供对允许应用的精细控制权

公司计划在未来几个月将该模式扩展至消费者版本,同时推出新的合规API日志以帮助组织追踪使用情况。

高风险功能的明确警示标签

第二项重大变化是在ChatGPT、ChatGPT Atlas和Codex中引入了标准化的"高风险"标签。当用户激活可能危及安全的功能时,这些警告就会出现。

"某些功能虽然提升了实用性,但带来了行业尚未完全解决的风险,"OpenAI承认道。这些标签提供:

  • 对潜在危险的清晰说明
  • 建议的缓解策略
  • 适用场景指南

当开发者启用网络访问或其他可能暴露隐私数据的功能时,这些警告尤为重要。

为何此时推出这些变更

这些更新正值企业越来越多地将AI系统与其内部工具和面向客户的应用程序连接之际。虽然这种整合释放了强大能力,但也创造了新的漏洞。

提示注入攻击可以通过精心设计的输入来操纵AI行为——可能诱骗聊天机器人泄露机密信息或执行未经授权的操作。近期全行业的多起事件凸显了这些风险。

OpenAI强调这些保护措施是对沙盒化和URL过滤等现有安全机制的补充而非替代。

公司建议管理员在启用锁定模式前仔细评估其安全需求,并指出其限制可能会影响一般使用场景下的功能性。

关键要点:

  • 全新锁定模式严格限制高安全场景下的外部交互
  • 标准化风险标签帮助用户在激活功能前了解潜在危险
  • 防护措施针对操纵AI行为的提示注入攻击
  • 更新目前适用于企业和机构版本,即将面向消费者推出
  • 各项措施建立在现有沙盒化和数据泄露防护机制基础之上

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

印度以1亿周活跃用户成为ChatGPT全球第二大市场,崛起为AI强国
News

印度以1亿周活跃用户成为ChatGPT全球第二大市场,崛起为AI强国

OpenAI首席执行官Sam Altman透露,印度已成为ChatGPT全球第二大市场,拥有1亿周活跃用户。该公司通过'ChatGPT Go'等举措重点布局 affordability 的战略尤其受到学生群体欢迎。随着科技巨头在印度AI领域激烈竞争,商业化与基础设施方面的挑战依然存在。这一消息发布之际,一场吸引全球行业领袖的重要AI峰会即将召开。

February 16, 2026
人工智能ChatGPT印度科技
OpenAI忍痛停用问题缠身的GPT-4o,忠实用户心碎不已
News

OpenAI忍痛停用问题缠身的GPT-4o,忠实用户心碎不已

OpenAI本周将退役五款旧版ChatGPT模型,其中饱受争议的GPT-4o位列关停名单首位。该模型面临多起诉讼指控其鼓励用户危险行为。尽管仅剩80万活跃用户——其中许多已形成情感依赖——安全考量最终迫使OpenAI做出决定。这一决定引发了请愿活动,那些声称GPT-4o拯救过自己生命的人们纷纷抗议。

February 14, 2026
OpenAIGPT模型AI安全
News

OpenAI放下骄傲:财务压力下ChatGPT推出广告

令人意外的是,OpenAI本周开始在ChatGPT中投放广告——这与CEO萨姆·奥特曼过去反对聊天机器人广告的立场直接相悖。此举正值这家AI巨头面临惊人的计算成本,预计四年内将达到1000亿美元。虽然去年130亿美元的收入对大多数初创企业来说都很可观,但对于OpenAI的雄心计划而言仍显不足。该公司如今在变现与维护旗舰产品用户信任之间如履薄冰。

February 13, 2026
OpenAIChatGPTAI变现
谷歌Gemini遭遇大规模AI模型提取攻击
News

谷歌Gemini遭遇大规模AI模型提取攻击

谷歌Gemini AI聊天机器人遭受了一场精心策划的攻击,黑客通过向其发送超过10万条提示指令,成功提取了核心算法。安全专家警告称,这种'模型蒸馏'技术威胁着整个AI行业,可能导致竞争对手窃取专有技术。此次攻击凸显出随着企业日益依赖包含敏感商业逻辑的定制AI系统,其面临的漏洞风险正不断加剧。

February 15, 2026
AI安全谷歌Gemini网络威胁
News

OpenAI悄然从其使命中删除'安全第一'承诺

OpenAI已悄然从其官方使命声明中移除关键安全承诺,引发对其优先事项转变的担忧。这家由非营利转型为商业实体的机构不再明确承诺开发'不受财务回报限制'的AI或将安全置于首位。这一变化正值内部动荡时期,包括其伦理团队解散和内容政策引发的新争议。

February 15, 2026
OpenAIAI伦理科技政策
News

OpenAI的100亿美元豪赌:GPT-5.3在Cerebras芯片上发布

OpenAI通过推出首个运行在Cerebras Systems硬件上的人工智能模型GPT-5.3-Codex-Spark,朝着减少对NVIDIA依赖迈出了重要一步。这款新型编码助手为开发者提供了实时中断能力和完整工作流支持。这标志着OpenAI与Cerebras价值100亿美元大规模合作的首个成果,目标是在2028年前部署750兆瓦的替代计算能力。

February 13, 2026
人工智能硬件OpenAICerebras Systems