跳转到主要内容

Thinking Machines Lab实现AI输出100%一致性

Thinking Machines Lab攻克AI随机性难题

在人工智能研究的里程碑式成就中,Thinking Machines Lab成功解决了大型语言模型开发中最持久的挑战之一:输出不一致性。由前OpenAI首席技术官Mira Murati创立的实验室在他们最近的研究报告中宣布了这一技术突破。

非确定性输出的问题

即使将温度参数设为零,传统LLM仍难以对相同输入产生相同输出。题为《击败LLM推理中的非确定性》的研究论文指出了两个主要技术原因:

  1. 浮点加法的非结合性:在GPU并行计算环境中,(a + b) + c与a + (b + c)等计算序列会出现微小变化。
  2. 并行计算策略变化:批量大小、序列长度和KV缓存状态的改变会影响GPU内核选择策略。

Image

技术解决方案

该实验室开发了一种批量不变解决方案,确保:

  • 不同批量大小下的计算顺序一致
  • 无论序列如何分割都能获得相同结果
  • 优化了包括RMSNorm和注意力机制在内的计算模块

团队使用Qwen3-235B-A22B-Instruct-2507模型(2350亿参数)验证了他们的方法。经过1000次重复测试后,该模型实现了前所未有的100%输出一致性

Image

行业影响

这一突破对以下领域具有重要意义:

  • 需要绝对一致性的金融风险评估系统
  • 可靠性至关重要的医疗诊断应用
  • 需要可预测输出的法律文件分析 该实验室已公开他们的发现,为全球AI开发者提供了宝贵见解。

关于Thinking Machines Lab

成立于2023年并获得20亿美元种子资金,该实验室专注于基础AI技术。他们计划在未来几个月推出首款商业产品。

这一成就标志着行业从追求纯粹模型规模转向优先考虑应用质量和可靠性的转变。

完整研究报告可在以下网址查看:https://thinkingmachines.ai/blog/defeating-nondeterminism-in-llm-inference/

关键要点:

  • 解决了LLM输出随机性的长期问题
  • 确定了两个主要技术原因
  • 开发了批量不变解决方案
  • 在测试中实现了100%一致性
  • 对企业应用具有重大意义

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

DeepSeek V4 横空出世:万亿参数AI模型携百万token记忆窗口来袭

中国深度求索公司即将发布V4 AI模型,其突破性能力或将重塑行业格局。这个万亿参数系统具备原生多模态处理能力及史无前例的100万token上下文窗口——足以一次性消化整本书籍。在战略调整中,DeepSeek优先为华为等国内硬件合作伙伴进行优化而非外国芯片制造商,彰显中国日益增长的AI自主性。随着内部测试的展开,科技界正热切期待这场可能改变游戏规则的发布。

February 26, 2026
人工智能DeepSeekAI发展
News

中国AI初创企业杰宇星瞄准香港IPO,目标募资5亿美元

总部位于上海的AI独角兽企业杰宇星正筹备赴港上市,公司估值可能超过20亿美元。这家由前微软高管蒋大新执掌、腾讯等科技巨头支持的企业,近期获得重大融资以推进其雄心勃勃的'AI+终端'战略。此举或将使杰宇星成为中国首批上市的重要AI模型初创企业之一。

February 26, 2026
人工智能首次公开募股科技创业
蚂蚁数科全球科技布局再下一城 马来西亚AI服务中心正式启动
News

蚂蚁数科全球科技布局再下一城 马来西亚AI服务中心正式启动

中国科技巨头蚂蚁数科正通过最新举措在国际市场掀起波澜——为其旗舰AI产品ZOLOZ在马来西亚建立运营中心。这一战略扩张正值全球企业级AI解决方案需求激增之际,Palantir和OpenAI等公司均报告创纪录增长。马来西亚中心将提升本地服务能力,同时蚂蚁数科正同步开发新的企业级AI模型。

February 26, 2026
人工智能金融科技全球化布局
百度AI业务腾飞:云计算与自动驾驶齐头并进,年收入突破400亿元
News

百度AI业务腾飞:云计算与自动驾驶齐头并进,年收入突破400亿元

百度2025年财报显示,这家公司已因AI转型焕然新生,其人工智能部门年收入达400亿元人民币。这家科技巨头在所有AI领域均实现爆发式增长——云计算收入跃升34%,自动驾驶服务增长三倍,AI营销平台更是惊人地增长了301%。随着文心5.0模型的推出及全球自动驾驶出租车服务的扩展,百度已稳居中国AI领军地位。

February 26, 2026
人工智能科技行业自动驾驶
News

MiniMax估值飙升至389亿美元,高盛报告凸显中国AI成本优势

中国的MiniMax以其惊人的高效AI技术引起华尔街关注。高盛首次覆盖报告给予这家多模态AI公司389亿美元的估值,强调其能以竞争对手几分之一的成本实现顶级性能。MiniMax的独特之处何在?一是保持低成本高质量的巧妙技术架构,二是罕见的收入结构——70%来自海外市场。

February 26, 2026
人工智能科技估值中国创新
News

阿里云通过多模型切换革新AI访问方式

阿里云通义平台推出突破性的编程方案,可无缝切换四种顶尖中国开源AI模型。开发者现在能根据需求轻松切换Qwen3.5、GLM-5、MiniMax M2.5和Kimi K2.5模型,无需再为管理多个API而烦恼。这项创新为探索AI解决方案的企业提供了更大灵活性、成本节约和稳定性。

February 25, 2026
人工智能云计算科技创新