跳转到主要内容

Grok 4.20直击AI最大缺陷:捏造事实

xAI以全新Grok版本押注诚实

在这个痴迷于基准测试和速度的行业里,埃隆·马斯克的xAI正采取一种逆向策略。他们新推出的Grok 4.20模型优先考虑了许多用户希望其他AI能关注的一点:不胡编乱造。

Image

真相重于性能

Artificial Analysis的独立测试揭示了Grok的独特优势:

  • 78%的非幻觉率——有史以来最高记录
  • 愿意说"我不知道"而非编造答案
  • 在智力测试中得分较低(48分 vs 竞争对手57分)但在可靠性上胜出

"我们厌倦了模型假装成先知,"一位熟悉该项目的xAI工程师表示,"Grok知道自己的局限——这反而让它更有用。"

为不同需求打造

该模型提供三种模式:

推理模式 准确率冠军,创下最低幻觉记录,但速度较慢

标准模式 平衡日常对话和快速响应需求

多智能体模式 多个AI实例协同处理复杂任务

超越准确率的竞争优势

xAI不仅依靠诚实来推销Grok:

  • 超大上下文窗口:可处理多达200万token(相当于整本书)
  • 价格下调:每百万token 2-6美元,低于先前版本和竞争对手

该策略似乎针对那些错误答案比慢速响应代价更高的企业。正如一位分析师所说:"不是每家公司都需要莎士比亚——但没有公司想要一个骗子。"

此次发布标志着xAI从追逐通用人工智能转向解决实际企业问题。对于研究团队和数据敏感行业来说,Grok可能成为继OpenAI和谷歌之后的第三个可信选择。

关键点:

  • Grok 4.20实现创纪录的低幻觉率(78%事实准确)
  • 三种专用模式满足不同准确率/速度需求
  • 超大上下文窗口(200万token)搭配竞争力价格(2-6美元/百万)
  • 目标用户是优先考虑可靠性而非原始性能的企业

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

快手AI人才争夺战升级:春季招聘大模型专家需求激增三倍

快手2026春季招聘以出人意料的方式拉开帷幕——大模型人才需求较往年增长三倍。这家中国科技巨头为吸引顶尖AI毕业生提供快速晋升通道和丰厚待遇,彰显了这些技能在当前竞争格局中的关键地位。从基础设施到应用层覆盖200多个岗位的招聘热潮,揭示了快手将AI深度融入视频生态的雄心。

March 13, 2026
AI招聘大语言模型科技职业
腾讯为镜像站点辩护,回应OpenClaw数据抓取争议
News

腾讯为镜像站点辩护,回应OpenClaw数据抓取争议

腾讯回应了OpenClaw开发者Peter Steinberger的指控,后者称这家科技巨头未经许可抓取其平台数据。腾讯坚称其SkillHub镜像站点实际上将原平台的流量压力降低了99%,这场争议凸显了在AI热潮中开源开发者与企业生态扩张之间持续存在的紧张关系。

March 12, 2026
OpenClawTencentAI伦理
马斯克的xAI与特斯拉联手打造'Macrohard'——对微软的戏谑调侃背后隐藏严肃AI野心
News

马斯克的xAI与特斯拉联手打造'Macrohard'——对微软的戏谑调侃背后隐藏严肃AI野心

埃隆·马斯克揭晓了旗下公司xAI与特斯拉之间一项引人入胜的合作——这个被戏称为'Macrohard'(明显影射微软)或'数字擎天柱'的双脑AI系统。该创新项目将xAI的Grok模型战略思维与特斯拉实时响应技术相结合,竟能在出人意料的经济型硬件上运行。马斯克宣称其最终可能实现整个企业的自动化,或将撼动软件行业。该系统通过监控用户屏幕和输入来实现类人反应速度,标志着企业级AI自动化的重大进展。

March 12, 2026
人工智能埃隆·马斯克科技创新
News

作家以空白书大胆抗议AI版权侵权

在一场前所未有的反抗行动中,包括石黑一雄在内的近万名作家联合出版了一本名为《别偷这本书》的完全空白书籍。这场震撼性抗议直指未经许可使用受版权保护作品训练AI模型的企业。象征性的空白页预示着若版权保护不加强,文学未来可能面临的空洞化。此次抗议恰逢英国版权法改革关键时期,现行草案更偏向AI公司而非创作者。

March 10, 2026
AI版权文学抗议知识产权
News

五角大楼坚持对Anthropic的AI风险评估,无视其法律诉讼

美国国防部加倍强调其对AI公司Anthropic的争议性'供应链风险'认定,并驳斥这家初创企业的法律挑战无效。副次长Emil Michael称这起诉讼在意料之中,但最终与军事决策无关。争论的核心在于对AI在国防应用中应如何使用的基本分歧——Anthropic主张伦理边界,而军方寻求更广泛的授权。

March 10, 2026
AI伦理国防科技政府合同
News

科技巨头联合对抗五角大楼,掀起AI伦理之战

在一次前所未有的团结行动中,来自OpenAI和Google DeepMind的30多名员工公开支持Anthropic对五角大楼发起的法律挑战。这场争端聚焦于AI技术的军事应用,科技从业者认为国防部的'供应链风险'认定威胁行业安全标准,可能削弱美国在人工智能领域的竞争力。

March 10, 2026
AI伦理国防科技科技行动主义