GPT-5.2在浏览器构建挑战中超越Claude Opus
AI对决:GPT-5.2证明其工程实力
从零构建网页浏览器不仅仅是另一项编码挑战——它是对AI系统工程师式思维能力的终极测试。编程平台Cursor的最新测试揭示了当面对这项编程马拉松任务时,主流AI模型之间令人惊讶的差异。
浏览器挑战详解
该实验不是编写代码片段或修复错误——它需要在数周时间内从头创建HTML解析器到JavaScript虚拟机等所有组件。这意味着要在数百万行代码中保持逻辑一致性,同时不断优化设计并管理依赖关系。
"我们在这里看到了新现象,"一位参与测试的Cursor团队成员解释道,"这不再仅仅是编码技能的问题——而是这些系统能否长期维持复杂工程思维的问题。"
GPT-5.2领先优势
OpenAI的最新模型给研究人员留下了深刻印象,其能力包括:
- 在整个长期项目中保持专注
- 自主修正早期设计缺陷
- 协调不同系统组件之间的工作
- 抵抗"目标漂移"——即偏离原始目标的倾向
与此同时,Anthropic的Claude Opus 4.5虽然在短期任务上表现优异,但倾向于:
- 过早寻求完成点
- 更频繁地将控制权交还给人类程序员
- 在长开发周期中难以维持上下文连贯性
当GPT-5.2成功复制Windows7模拟器并迁移遗留系统时——这些传统上需要人类团队数月才能完成的任务——两者的差异变得尤为明显。
The implications? We might be entering an era where AI can truly partner with developers rather than just assist them."



