跳转到主要内容

xAI推出Grok 4.20:懂得何时说'我不知道'的人工智能

xAI以新版Grok押注真实性

当大多数人工智能公司追逐越来越高的基准分数时,埃隆·马斯克的xAI正在解决可能是人工智能最尴尬的问题:它倾向于自信地胡说八道。新发布的Grok 4.20模型在可靠性方面取得了重大进展,尽管它在原始智力方面并未登顶。

Image

诚实优势

Artificial Analysis的独立测试揭示了Grok 4.20的独特优势:

  • 创纪录的低幻觉率:在"非幻觉"指标上获得78%的分数,为事实准确性设定了新的行业标准
  • 坦然面对不确定性:与其他在不确定时编造答案的模型不同,Grok更频繁地承认"我不知道"——这对专业用途来说是一个出奇有价值的功能
  • 平衡的智力:虽然其48分的推理分数落后于领先模型(57分),但这种权衡优先考虑可信度而非推测性 brilliance

为不同需求打造

xAI提供三种不同的操作模式:

推理模式 - 推动Grok创纪录表现的准确性冠军,尽管速度比其他选择慢 标准模式 - 针对日常交互和快速响应进行了优化 多代理模式 - 允许多个人工智能实例协作解决复杂问题

具有竞争力的定价满足企业需求

商业策略与技术创新相匹配:

  • 巨大的上下文窗口:可处理多达200万个token——足以一次性处理整本书或代码库
  • 激进的定价:每百万token2-6美元的价格既低于其前代产品,也低于许多西方竞争对手的价格

一位分析师指出:"当其他公司追求无所不知时,Grok的目标是成为从不撒谎的助手。"对于那些事实准确性胜过理论能力的企业来说,xAI可能创造了第一个真正可行的行业领导者替代品。

关键点:

  • Grok 4.20实现78%的非幻觉率——同类最佳
  • 三种专用模式满足不同用例需求
  • 定价具有竞争力,每百万token2-6美元
  • 200万token的大上下文窗口可处理大量文档
  • 将自己定位为市场领导者的"诚实"替代品

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

马斯克的xAI与特斯拉联手打造'Macrohard'——对微软的戏谑调侃背后隐藏严肃AI野心
News

马斯克的xAI与特斯拉联手打造'Macrohard'——对微软的戏谑调侃背后隐藏严肃AI野心

埃隆·马斯克揭晓了旗下公司xAI与特斯拉之间一项引人入胜的合作——这个被戏称为'Macrohard'(明显影射微软)或'数字擎天柱'的双脑AI系统。该创新项目将xAI的Grok模型战略思维与特斯拉实时响应技术相结合,竟能在出人意料的经济型硬件上运行。马斯克宣称其最终可能实现整个企业的自动化,或将撼动软件行业。该系统通过监控用户屏幕和输入来实现类人反应速度,标志着企业级AI自动化的重大进展。

March 12, 2026
人工智能埃隆·马斯克科技创新
xAI创始团队再减员,又一位联合创始人离职
News

xAI创始团队再减员,又一位联合创始人离职

埃隆·马斯克的人工智能企业xAI再次面临高层变动,联合创始人托比·波伦宣布离职。随着波伦的辞职,最初十二位创始成员中仅剩五人仍在公司。这位前数字代理项目负责人在社交媒体上深情回顾了三年高强度工作历程,并调侃终于能睡个好觉。这标志着xAI成立不到三年来第七位创始成员的离开。

February 27, 2026
xAIElonMuskArtificialIntelligence
News

AI重塑职场:初级岗位能否幸存?

Anthropic最新AI升级正通过强大的插件改变职场生态,这些工具能处理人力资源、财务等多项工作。虽然提升了效率,但也引发尖锐问题:企业是否还需要初级员工?AI会否造成技能断层?与此同时,员工私下使用未经授权工具的'影子AI'现象激增。这场职场革命既带来希望,也伴随着复杂挑战。

February 25, 2026
未来工作企业级AI数字化转型
News

马斯克的Grok AI获五角大楼合同,伦理僵局使Anthropic陷入困境

在军事AI领域的戏剧性转变中,埃隆·马斯克的xAI公司凭借其Grok模型获得了五角大楼机密系统的访问权,填补了Anthropic因拒绝解除伦理限制而留下的空白。国防部正施压Anthropic接受更广泛的使用条款,否则将面临制裁,与此同时谷歌和OpenAI也在争相争取各自的军事合同。这场高风险的对峙凸显了AI伦理与国家安全优先事项之间日益紧张的矛盾。

February 24, 2026
军事AIxAI五角大楼合同
News

xAI遭遇人才流失危机:联合创始人离职,挑战加剧

埃隆·马斯克的人工智能企业xAI再遭高层变动,联合创始人Tony Wu宣布离职,标志着创始团队在三年内已流失近半数成员。该公司在筹备潜在IPO之际,正面临技术障碍与激烈竞争。专家质疑xAI能否在日益增长的压力下稳定人才队伍。

February 11, 2026
xAI人工智能科技人才
News

蚂蚁科技押注企业AI,新设大模型事业部彰显雄心

蚂蚁数字科技通过成立专门的大模型技术创新部门进行架构调整,彰显其在企业AI领域的雄心壮志。由CEO赵文彪领衔的团队将专注于将百灵大模型适配实际商业场景。目前已服务中国主要银行的蚂蚁,正将其AI解决方案拓展至制造业、能源等更广阔领域。

February 4, 2026
企业级AI蚂蚁集团大语言模型