Meta发布OMol25数据集与UMA模型:AI驱动化学研究新突破
Meta通过发布分子研究领域最大的开放数据集OMol25和革命性化学特性预测工具通用原子模型(UMA),在AI驱动化学领域实现重大飞跃。这些突破将重塑从制药到可再生能源等多个领域。
OMol25数据集:分子研究的宝库
包含超过1亿个高精度分子计算数据的OMol25远超现有公开数据集规模。Meta投入超60亿计算小时构建这一资源,涵盖:
- 小型有机化合物
- 生物分子(蛋白质、DNA片段)
- 金属配合物与电解质
该数据集提供前所未有的细节,包括能量值、力测量、电荷分布和轨道数据。研究人员可通过Hugging Face平台访问OMol25。

UMA:原子级预测器
配套的通用原子模型标志着计算化学的范式转变。与传统需要针对每项任务开发专用模型的方法不同,UMA具备:
- 原子级特性预测能力
- 比传统方法快1000倍的计算速度
- 在药物研发与材料科学领域的普适性
基于采用"混合线性专家"架构的先进图神经网络,UMA在保持计算效率的同时达到专用模型的精度水平。据Meta报告,原本需要数日的任务现可在数秒内完成。
加速科研发现
该技术使研究人员能够:
- 快速筛选数千种分子候选物
- 在合成前评估药物或电池材料潜力
- 通过"伴随采样"探索新型化学空间——这项全新AI技术无需真实样本即可生成可行分子结构
伴随采样方法源自随机控制理论,对含柔性组分的分子特别有效。所有模型与代码均可在Hugging Face和GitHub获取。
当前局限与未来方向
尽管具有变革性,该系统仍存在限制:
- 对聚合物和某些金属化合物的覆盖有限
- 电荷与长程相互作用的预测仍有改进空间 这些缺口为未来研究合作提供了机遇。
核心要点
- OMol25包含1亿+分子数据点——最大规模的公开化学数据集
- UMA的原子特性预测速度比传统方法快1000倍
- "伴随采样"技术实现无需真实样本的结构生成
- 应用领域涵盖药物发现、电池技术与催化剂开发




