跳转到主要内容

xAI的Grok 4.20版本:以诚信为本,而非炒作

xAI在最新Grok版本中优先考虑真实性

在一个痴迷于基准分数和处理速度的行业中,埃隆·马斯克的xAI正以一种不同的方式掀起波澜。他们新推出的Grok 4.20Beta模型或许在原始智能指标上未能登顶,但在最重要的方面——讲真话——设定了新标准。

Image

打破幻觉习惯

AI界长期受困于模型自信地编造谎言——研究人员称之为“幻觉”。Grok 4.20直面这一问题,具备以下特点:

  • 78%的非幻觉率(最新测试中的行业新纪录)
  • 改进的承认不确定性能力,而非编造答案
  • 核心架构中内置更佳的事实核查功能

“我们并非试图打造最聪明的AI,”xAI发言人解释道,“我们要打造最值得信赖的AI。”

以可靠性为核心的性能表现

Artificial Analysis的独立评估显示Grok得分如下:

  • 48分(在智能基准测试中落后于部分竞争对手)
  • 满分(在事实可靠性和诚实度指标上) 这一差距揭示了xAI的战略选择——牺牲部分原始能力以换取前所未有的准确性。

Grok的三种使用方式

公司提供多种API选项:

  1. 推理模式:适用于准确性重于速度的深度分析
  2. 标准模式:平衡的日常交互
  3. 多代理模式:由协作的AI团队处理复杂任务

推理模式表现尤为突出,展示了谨慎处理如何减少错误。

具有竞争力的定价满足企业需求

除技术规格外,xAI还提出了引人注目的商业论点:

  • 单次处理高达200万token(足以应对整本书)
  • 成本仅为每百万token2-6美元
  • 保持与现有系统的兼容性 该定价低于先前版本及许多竞争对手。

为何此刻至关重要

随着企业日益依赖AI做出关键决策,信任变得至关重要。当其他模型追逐通用人工智能时,Grok专注于保持一贯正确而非令人印象深刻的聪明。

这一方法引起了那些厌倦反复核查AI输出的专业人士的共鸣。“终于,”一位早期测试者表示,“有了一个不会为了表现好而撒谎的助手。”

关键点:

  • Grok 4.20优先考虑事实准确性而非原始性能指标
  • 为低幻觉率设定新标准(78%的非幻觉率)
  • 三种专用API模式满足不同业务需求
  • 具有竞争力的定价(每百万token2-6美元)
  • 庞大的200万token上下文窗口可处理复杂文档

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

马斯克的xAI与特斯拉联手打造'Macrohard'——对微软的戏谑调侃背后隐藏严肃AI野心
News

马斯克的xAI与特斯拉联手打造'Macrohard'——对微软的戏谑调侃背后隐藏严肃AI野心

埃隆·马斯克揭晓了旗下公司xAI与特斯拉之间一项引人入胜的合作——这个被戏称为'Macrohard'(明显影射微软)或'数字擎天柱'的双脑AI系统。该创新项目将xAI的Grok模型战略思维与特斯拉实时响应技术相结合,竟能在出人意料的经济型硬件上运行。马斯克宣称其最终可能实现整个企业的自动化,或将撼动软件行业。该系统通过监控用户屏幕和输入来实现类人反应速度,标志着企业级AI自动化的重大进展。

March 12, 2026
人工智能埃隆·马斯克科技创新
News

马斯克法庭炮轰OpenAI:称ChatGPT风险大于收益

埃隆·马斯克本周在法庭上抛出爆炸性指控,声称OpenAI的ChatGPT导致用户自杀,同时吹捧其xAI的安全记录。这位特斯拉CEO在一起诉讼中作证,该诉讼源于他在2023年呼吁暂停AI开发的公开信上的签名。在批评OpenAI盈利动机的同时,马斯克自身也面临审查,因监管机构正在调查其Grok AI生成的露骨内容。

February 28, 2026
人工智能科技监管埃隆·马斯克
xAI创始团队再减员,又一位联合创始人离职
News

xAI创始团队再减员,又一位联合创始人离职

埃隆·马斯克的人工智能企业xAI再次面临高层变动,联合创始人托比·波伦宣布离职。随着波伦的辞职,最初十二位创始成员中仅剩五人仍在公司。这位前数字代理项目负责人在社交媒体上深情回顾了三年高强度工作历程,并调侃终于能睡个好觉。这标志着xAI成立不到三年来第七位创始成员的离开。

February 27, 2026
xAIElonMuskArtificialIntelligence
News

AI重塑职场:初级岗位能否幸存?

Anthropic最新AI升级正通过强大的插件改变职场生态,这些工具能处理人力资源、财务等多项工作。虽然提升了效率,但也引发尖锐问题:企业是否还需要初级员工?AI会否造成技能断层?与此同时,员工私下使用未经授权工具的'影子AI'现象激增。这场职场革命既带来希望,也伴随着复杂挑战。

February 25, 2026
未来工作企业级AI数字化转型
News

马斯克的Grok AI获五角大楼合同,伦理僵局使Anthropic陷入困境

在军事AI领域的戏剧性转变中,埃隆·马斯克的xAI公司凭借其Grok模型获得了五角大楼机密系统的访问权,填补了Anthropic因拒绝解除伦理限制而留下的空白。国防部正施压Anthropic接受更广泛的使用条款,否则将面临制裁,与此同时谷歌和OpenAI也在争相争取各自的军事合同。这场高风险的对峙凸显了AI伦理与国家安全优先事项之间日益紧张的矛盾。

February 24, 2026
军事AIxAI五角大楼合同
News

维基百科创始人驳斥马斯克AI百科全书为有缺陷的模仿品

维基百科创始人吉米·威尔士对埃隆·马斯克的Grokipedia等AI竞争对手并不担忧。在一次坦诚采访中,这位互联网先驱指出了AI生成内容的关键缺陷,并引用OpenAI研究显示高达79%的幻觉率。威尔士力推维基百科以人类为主导的模式——由志愿者专家确保准确性,他表示这是当前AI技术尚无法企及的。

February 22, 2026
维基百科人工智能信息完整性