初创公司大胆宣称:新型AI芯片性能或超越英伟达5倍
初创公司以激进新AI芯片设计挑战英伟达
在这场争夺AI计算霸主地位的高风险竞赛中,名为Positron的小型初创公司凭借大胆声明掀起波澜。其最新发布的Asimov芯片架构专为大型语言模型推理设计,承诺能效比英伟达下一代Rubin平台高出五倍。
能效突破
Positron的方案有何不同?该公司对传统GPU设计进行了精简化处理,剔除了所有非AI推理必需的组件。"我们自问:运行当今庞大语言模型真正需要什么?"Positron首席技术官在接受采访时解释道,"答案让我们移除了拖累传统设计的通用电路部分"
成果是他们所称的"纯张量处理"架构,最大限度减少能源浪费。早期测试表明,这种精简方法可能显著降低功耗和制造成本——这两个关键因素正困扰着应对现代AI电力需求的数据中心。
挑战英伟达
但纸面参数不能保证成功。英伟达的统治地位不仅源于硬件——更是数十年软件生态建设的成果。Positron承认这一障碍,正加速构建兼容工具,让开发者能以最小代价迁移现有PyTorch和TensorFlow模型。
该公司特别为Transformer架构模型(ChatGPT等系统的基础)优化了Asimov,声称可高效处理万亿参数模型,兼具高吞吐量和低延迟。若属实,这将使Asimov对大规模部署语言模型的企业极具吸引力。
行业影响
分析师视Positron此举为芯片行业更广泛转型的一部分。"我们正在超越通用计算的时代"技术分析师Maria Chen指出,"若真能兑现能效承诺,Asimov这类专用推理芯片可能重塑大型AI模型的运行经济学"
这关乎重大利益。随着数据中心为AI工作负载消耗更多电力,即便是 modest效率提升也能带来规模化成本节约。五倍改进将是革命性的——前提是Positron能在实际部署中证明其主张。
关键要点:
- ⚡ 极致能效: 宣称每瓦性能比英伟达即将推出的Rubin架构高5倍
- ✂️ 极简设计: 通过移除通用组件专注纯张量处理
- 🤖 Transformer优化: 专为当前主流AI模型架构定制的硬件
- 🏗️ 生态挑战: 成功取决于构建能与英伟达成熟平台匹敌的开发者工具


