GPT-5.4在计算机控制领域超越人类
GPT-5.4实现人类级计算机控制
2026年3月,OpenAI发布了革命性的GPT-5.4模型,从根本上改变了人工智能与计算机交互的方式。与需要专用接口的先前版本不同,这一迭代版本可以直接操作计算机——识别屏幕截图、模拟鼠标点击和键入命令,就像人类用户一样。
令人瞩目的基准测试表现
OSWorld-Verified测试显示,GPT-5.4在桌面导航任务中取得了75%的成功率,超过了人类72.4%的平均水平。这一里程碑意味着AI现在可以比许多人更有效地控制计算机——这种能力在几年前还是难以想象的。
从助手到数字同事
早期采用者报告称GPT-5.4以惊人的技巧处理计算机操作:
- 应用程序精通:它能独立启动日历应用设置提醒,并导航第三方软件(如播客播放器)查找特定内容
- 系统级访问:该AI能按指令更改壁纸,并能熟练操作终端环境
- 原生计算:它不仅提供答案,还能自然地打开并使用计算机的计算器应用
这一演变将AI从对话伙伴转变为能像我们一样与技术交互的合格数字工作者。
OpenClaw协同效应
开源项目OpenClaw在GPT-5.4中找到了完美搭档。它们共同创造的AI代理能够:
- 无需复杂变通方案即可自动化桌面任务
- 凭借扩展的内存容量在长时间操作中保持上下文
- 通过优化处理显著降低运营成本
- 处理包括财务分析在内的复杂专业工作
这种组合被开发者称为"首个真正实用的AI员工"。
行业反响:分水岭时刻
科技领袖们认识到其影响: "GPT-5.4的编程能力近乎完美,"HyperWriteAI首席执行官Matt Shumer指出。 Mercor AI的Brenda补充道:"我们看到AI正在超越顶级咨询公司的专业水平" 这些发展表明即使是高技能工作也面临着前所未有的自动化潜力。
关键要点:
- 人类级表现:GPT-5.4在计算机控制上超过普通人类能力(75% vs 72.4%成功率)
- 原生操作:首个无需适配器或特殊接口就能直接使用计算机的通用AI模型
- 专业应用:与OpenClaw结合后可为复杂任务创造合格的数字工作者
- 行业影响:预示着知识工作领域可能面临的颠覆
