跳转到主要内容

阿里巴巴小型AI强者LOGOS超越科技巨头

小模型,大成果

阿里巴巴ATH-Token Foundry出人意料地发布了LOGOS——这个开源AI模型正在改写科学计算的规则。尽管只有10亿参数,LOGOS在多项科学任务中持续超越微软56亿参数的NatureLM。Image

"就像发现一辆超越重型赛车的小型车,"中国人民大学高强研究院开发团队成员陈伟博士解释,"关键在于我们对科学数据的统一处理方法。"

打破科学壁垒

真正突破在哪?LOGOS掌握着通用科学语言。当以往模型需要不同系统处理蛋白质、化学品等科学数据时,LOGOS通过以下方式统一处理:

  • 覆盖7种数据类型的共享词汇表
  • 448.7亿token的训练数据
  • 创新的3D结构"文本描述"方法

Image

"想象一下不用复杂坐标就能描述分子相互作用,"首席研究员张立表示,"我们的模型能从简单序列建立空间理解——这在过去被认为是不可能的。"

从实验室即时落地

传统AI模型从研究到实际应用常需大量微调,而LOGOS完全消除了这个鸿沟。其训练格式与现实应用高度匹配,研究人员无需适配层即可直接部署。

阿里巴巴采取了罕见的全开源策略:

  • 完整模型权重
  • 推理代码
  • 技术文档

这种彻底透明性可能加速从药物研发到材料科学等多个领域的科学发现。

核心亮点

  • 体积与性能:LOGOS以小博大,超越更大模型
  • 通用翻译器:首个无缝处理多科学领域的系统
  • 开箱即用:消除了研究与应用间的传统障碍
  • 开放获取:向所有研究人员提供完整技术资源