跳转到主要内容

Claude 4.7收敛自夸倾向,聚焦精准表现

Anthropic为Claude 4.7选择差异化路线

当竞争对手追逐更高智力分数时,Anthropic为其最新Claude版本做出了不寻常的决策。4.7版本发布时附带了一个意外声明:"这不是我们最强大的模型"。该公司没有继续突破原始能力边界,而是专注于打造一个更少出错、懂得说"我不知道"的AI。

Image

数据表现依然亮眼

别把可靠性误认为弱点。Claude 4.7在关键基准测试中展现出显著提升:

  • SWE-bench Pro(编程领域): 从53.4%跃升至64.3%,超越GPT-5.4(57.7%)和Gemini 3.1 Pro(54.2%)
  • CharXiv(视觉推理): 凭借更精准的图像识别,从69.1%提升至82.1%
  • 法律AI任务: 在Harvey's BigLaw基准测试中达成90.9%准确率

唯一显著下降的是搜索评估(83.7%至79.3%),正是因为4.7版本在信息缺失时拒绝猜测——这个权衡多数用户都愿意接受。

改变的行为模式

早期使用者注意到了数据之外的变化。"它在技术讨论中会质疑我,"一位Replit高管表示,"就像帮助我做出更好决策的同事。"数据平台Hex观察到该模型现在会承认数据缺口,而非编造看似合理的数字。当工具失效时,4.7版本找到替代方案的几率是前代的三倍。

Vercel工程师发现了一个有趣的新行为:AI现在会在编写系统级代码前进行数学证明,这对语言模型而言展现了罕见的严谨性。

Image

可靠性的代价

这种可靠性需要成本。4.7版本生成相同文本会多产生1-1.35倍的token,在复杂问题上思考时间更长。Anthropic引入了新控制功能来管理这些需求,包括"超高强度"思考模式和面向开发者的预算追踪工具。

与此同时,传闻中的"Mythos"模型仍以"Project Glasswing"的名称进行有限测试,因安全性评估未完成而被认为暂不适合公开发布。

关键要点

  • Claude 4.7优先考虑可靠性而非最大化智力
  • 尽管采取更保守策略,基准测试仍有显著提升
  • 行为改变包括承认不确定性和寻找替代方案
  • token使用量增加35%以实现更彻底的处理
  • 企业专属"Mythos"模型仍在测试中

这次发布标志着AI发展的有趣转变——有时认清局限比成为房间里最聪明的存在更有价值。

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

Anthropic产品主管退出Figma董事会,AI威胁设计软件领域
News

Anthropic产品主管退出Figma董事会,AI威胁设计软件领域

Anthropic首席产品官Mike Krieger已退出Figma董事会,引发业界对这家AI公司在设计工具领域日益增长的野心的猜测。此举正值Anthropic准备推出具备原生设计功能的Opus4.7模型之际,这可能使其成为Figma的直接竞争对手。这一进展在科技行业引发涟漪,引发了关于AI日益侵入传统软件领域以及专业设计平台未来的问题。

April 17, 2026
AnthropicFigmaAI设计工具
AI编程助手之争:OpenAI的Codex升级对决Anthropic的Claude
News

AI编程助手之争:OpenAI的Codex升级对决Anthropic的Claude

随着OpenAI宣布对Codex进行重大升级,引入后台运行和浏览器集成功能,AI编程工具领域的霸主之争愈演愈烈。与此同时,Anthropic的Claude Code在企业市场持续扩张。最新升级包括增强记忆功能、图像生成技术和弹性定价策略,将AI编程助手推向新高度。

April 17, 2026
AI编程OpenAI开发者工具
Claude Opus 4.7 携更智能的AI与更敏锐的视觉来袭
News

Claude Opus 4.7 携更智能的AI与更敏锐的视觉来袭

Anthropic 最新 AI 模型 Claude Opus 4.7 在处理复杂任务和视觉处理方面带来显著升级。新版本支持最大 2,576 像素的图像,并引入自验证功能以提供更可靠的结果。虽然保持与前一版本相同的定价,用户需要调整提示词以充分利用其增强功能。Opus 4.7 可在多个平台使用,还提升了内存效率,在长对话中表现更佳。

April 17, 2026
Claude AIArtificial IntelligenceTech Updates
AI协议关键漏洞致20万台服务器暴露于风险之中
News

AI协议关键漏洞致20万台服务器暴露于风险之中

一份令人震惊的安全报告揭示了Anthropic广泛使用的MCP协议中存在危险漏洞,导致超过20万台AI服务器面临远程攻击风险。该设计缺陷允许执行未经验证的系统命令,影响所有主要编程语言。尽管数月前已收到通知,Anthropic对其研究人员称为架构级威胁的问题几乎未采取任何措施。

April 16, 2026
AI安全MCP漏洞网络安全
Anthropic机密项目Glasswing揭秘:它究竟发现了哪些漏洞?
News

Anthropic机密项目Glasswing揭秘:它究竟发现了哪些漏洞?

Anthropic雄心勃勃的Project Glasswing召集了亚马逊和谷歌等科技巨头,对其AI模型进行安全漏洞测试。但项目启动数月后,其实际发现仍笼罩在迷雾中。虽然研究人员找到了40个潜在漏洞,但只有1个被明确关联到Glasswing。在我们等待Anthropic七月报告的同时,这个强大AI模型究竟能检测到什么——以及企业是否在迅速跟进其发现——这些问题仍悬而未决。

April 16, 2026
AI安全Anthropic网络安全
News

Claude的新身份验证:对AI用户意味着什么

Anthropic针对Claude的某些功能推出了身份验证,要求用户提交政府身份证件和实时自拍。该公司与Persona Identities合作完成此流程,承诺数据不会用于训练或营销。虽然旨在促进AI的负责任使用,这一举措引发了AI社区关于隐私和可访问性的讨论。

April 15, 2026
AI监管数字身份Anthropic