前谷歌CEO旗下初创公司发布240亿参数化学专用AI
在科学人工智能领域取得重大进展之际,由前谷歌CEO埃里克·施密特投资的初创公司FutureHouse开源了ether0——一个专为化学推理设计的240亿参数模型。这一突破性系统展示了定向AI如何以相比传统方法显著减少的数据需求实现卓越性能。

与难以应对领域特定挑战的通用语言模型不同,ether0无需大量预训练就展现出非凡的化学直觉。FutureHouse团队通过创新的后训练技术实现了这一点,这些技术将模型能力聚焦于科学推理。"我们正在从多项选择测试转向真正的科学问题解决",项目研究团队解释道。
该模型的开发涉及从数千篇学术论文中挖掘化学实验数据,追踪溶解度和气味特征等分子特性。研究人员将这些原始数据转化为可验证的科学问题,用以训练ether0像化学家一样思考。
基于Mistral-Small-24B架构并通过强化学习优化,ether0处理了超过64万个化学问题,涵盖18项专业任务。这些任务包括合成可行性评估、血脑屏障渗透性预测和气味分析——传统模型经常在这些挑战中表现不佳。
性能基准测试结果令人信服。在与通用AI系统(Claude、o1)和专业化学模型(ChemDFM、TxGemma)的对比中,ether0在开放式回答场景中始终保持着更高的准确率。在选择题形式下,它同样保持高度竞争力——在某些特定任务上的准确率甚至是竞争对手的两倍。
效率提升同样令人印象深刻。传统的非推理模型需要多50倍的数据量才能接近ether0的反应预测准确度。虽然独立验证仍在进行中,但早期测试表明该模型能有效推理其训练数据中未包含的分子结构——这是真正理解而非模式识别的标志。
目前处于原型阶段的ether0已展现出三项变革性能力:
- 自然语言问题理解
- 分步化学推理
- 新颖分子结构生成
这些优势使其在类药分子设计领域特别有价值——该领域需要快速迭代和精准预测。随着研究的继续,ether0可能为跨学科构建通用科学推理系统树立新标准。
关键要点
- FutureHouse的ether0以240亿参数为化学AI树立新标杆
- 该模型在使用更少训练数据的同时超越专业竞争对手
- 推理行为蒸馏等创新技术提升了性能表现
- 应用范围涵盖从药物发现到材料科学创新
- 开源特性加速全球科学AI发展
