Grok 4.20直击AI最大缺陷：捏造事实欢迎来到AI DAMN！发现最震撼的最新AI新闻、最酷的AI产品和最前沿的AI项目。从ChatGPT到最新模型，我们精选让你惊呼'太牛了！'的AI发展动态。涵盖机器学习、深度学习等前沿技术，每日更新最精彩的人工智能世界。

发现

语言

账户

Grok 4.20直击AI最大缺陷：捏造事实

xAI以全新Grok版本押注诚实

在这个痴迷于基准测试和速度的行业里，埃隆·马斯克的xAI正采取一种逆向策略。他们新推出的Grok 4.20模型优先考虑了许多用户希望其他AI能关注的一点：不胡编乱造。

真相重于性能

Artificial Analysis的独立测试揭示了Grok的独特优势：

78%的非幻觉率——有史以来最高记录
愿意说"我不知道"而非编造答案
在智力测试中得分较低（48分 vs 竞争对手57分）但在可靠性上胜出

"我们厌倦了模型假装成先知，"一位熟悉该项目的xAI工程师表示，"Grok知道自己的局限——这反而让它更有用。"

为不同需求打造

该模型提供三种模式：

推理模式 准确率冠军，创下最低幻觉记录，但速度较慢

标准模式 平衡日常对话和快速响应需求

多智能体模式 多个AI实例协同处理复杂任务

超越准确率的竞争优势

xAI不仅依靠诚实来推销Grok：

超大上下文窗口：可处理多达200万token（相当于整本书）
价格下调：每百万token 2-6美元，低于先前版本和竞争对手

该策略似乎针对那些错误答案比慢速响应代价更高的企业。正如一位分析师所说："不是每家公司都需要莎士比亚——但没有公司想要一个骗子。"

此次发布标志着xAI从追逐通用人工智能转向解决实际企业问题。对于研究团队和数据敏感行业来说，Grok可能成为继OpenAI和谷歌之后的第三个可信选择。

关键点：

Grok 4.20实现创纪录的低幻觉率（78%事实准确）
三种专用模式满足不同准确率/速度需求
超大上下文窗口（200万token）搭配竞争力价格（2-6美元/百万）
目标用户是优先考虑可靠性而非原始性能的企业

喜欢这篇文章？

订阅我们的 Newsletter，获取最新 AI 资讯、产品评测和项目推荐，每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

快手AI人才争夺战升级：春季招聘大模型专家需求激增三倍

快手2026春季招聘以出人意料的方式拉开帷幕——大模型人才需求较往年增长三倍。这家中国科技巨头为吸引顶尖AI毕业生提供快速晋升通道和丰厚待遇，彰显了这些技能在当前竞争格局中的关键地位。从基础设施到应用层覆盖200多个岗位的招聘热潮，揭示了快手将AI深度融入视频生态的雄心。

AI招聘大语言模型科技职业

腾讯为镜像站点辩护，回应OpenClaw数据抓取争议

腾讯为镜像站点辩护，回应OpenClaw数据抓取争议

腾讯回应了OpenClaw开发者Peter Steinberger的指控，后者称这家科技巨头未经许可抓取其平台数据。腾讯坚称其SkillHub镜像站点实际上将原平台的流量压力降低了99%，这场争议凸显了在AI热潮中开源开发者与企业生态扩张之间持续存在的紧张关系。

OpenClawTencentAI伦理

马斯克的xAI与特斯拉联手打造'Macrohard'——对微软的戏谑调侃背后隐藏严肃AI野心

马斯克的xAI与特斯拉联手打造'Macrohard'——对微软的戏谑调侃背后隐藏严肃AI野心

埃隆·马斯克揭晓了旗下公司xAI与特斯拉之间一项引人入胜的合作——这个被戏称为'Macrohard'(明显影射微软)或'数字擎天柱'的双脑AI系统。该创新项目将xAI的Grok模型战略思维与特斯拉实时响应技术相结合，竟能在出人意料的经济型硬件上运行。马斯克宣称其最终可能实现整个企业的自动化，或将撼动软件行业。该系统通过监控用户屏幕和输入来实现类人反应速度，标志着企业级AI自动化的重大进展。

人工智能埃隆·马斯克科技创新

作家以空白书大胆抗议AI版权侵权

在一场前所未有的反抗行动中，包括石黑一雄在内的近万名作家联合出版了一本名为《别偷这本书》的完全空白书籍。这场震撼性抗议直指未经许可使用受版权保护作品训练AI模型的企业。象征性的空白页预示着若版权保护不加强，文学未来可能面临的空洞化。此次抗议恰逢英国版权法改革关键时期，现行草案更偏向AI公司而非创作者。

AI版权文学抗议知识产权

五角大楼坚持对Anthropic的AI风险评估，无视其法律诉讼

美国国防部加倍强调其对AI公司Anthropic的争议性'供应链风险'认定，并驳斥这家初创企业的法律挑战无效。副次长Emil Michael称这起诉讼在意料之中，但最终与军事决策无关。争论的核心在于对AI在国防应用中应如何使用的基本分歧——Anthropic主张伦理边界，而军方寻求更广泛的授权。

AI伦理国防科技政府合同

科技巨头联合对抗五角大楼，掀起AI伦理之战

在一次前所未有的团结行动中，来自OpenAI和Google DeepMind的30多名员工公开支持Anthropic对五角大楼发起的法律挑战。这场争端聚焦于AI技术的军事应用，科技从业者认为国防部的'供应链风险'认定威胁行业安全标准，可能削弱美国在人工智能领域的竞争力。

AI伦理国防科技科技行动主义

热门文章

台积电报告创纪录收入，人工智能增长为2025年带来乐观情绪

Nano Banana 2以毫米级精度重新定义AI艺术

DeepSeek V3 超越 Claude 3.5 在 AI 性能测试中

华硕发布 NUC AI Mini PC，配备彩色电子墨水显示屏

Claude AI助手登陆Slack，助力团队生产力提升