跳转到主要内容

新方法将语言模型训练中的能源消耗减少30%

研究人员开发了AI模型的节能训练方法

密歇根大学的研究人员最近进行了一项研究,揭示了一种节能的方法用于训练大型语言模型。这种新方法可以在相同时间内实现相同的结果,同时减少30%的能源消耗。这一发现的影响是显著的,因为节能可以为110万美国家庭提供电力,预计在2026年前实现。

Perseus的介绍

这个名为Perseus的创新软件工具,识别了被称为关键路径的任务序列——这是一组在训练过程中需要最长时间完成的子任务。通过战略性地管理非关键路径上的处理器速度,Perseus允许同时完成任务,有效消除不必要的电力消耗。

image

测试Perseus

在他们的研究中,团队将Perseus应用于训练多个AI模型,包括GPT-3、另外三个大型语言模型以及一个计算机视觉模型。这些测试结果表明,Perseus成功地减少了与AI训练相关的能源消耗,并保持与传统方法相同的训练速度。

对AI可及性的影响

研究人员强调,他们的节能方法在确保平等接入人工智能方面的重要性。在电力有限的地区,各国可能被迫依赖远程服务或使用较小、准确性较低的模型。这种情况可能加剧不同社区之间在接入AI技术方面的差距。

能源优化的重要性

这项研究的发现凸显了优化AI训练方法的潜力,不仅节约能源,而且保持效率。这一点尤为重要,因为对大型语言模型的需求不断增长,特别是在一个越来越关注减少碳足迹和增强可持续性的世界。

结论

随着人工智能领域的不断发展,像Perseus这样的工具的发展代表了向更可持续实践的有希望的转变。通过解决能源消耗问题,研究人员为未来铺平了道路,使AI技术既可接入又环保。

要点

  1. 密歇根大学开发了Perseus,使AI训练的能源消耗减少30%。
  2. 这种方法可以在2026年前节省相当于为110万户家庭供电的能源。
  3. Perseus在优化处理器使用的同时保持训练速度。
  4. AI的能源效率对确保各社区的平等接入至关重要。
  5. 这项研究突显了在技术发展中减少碳足迹的重要性。

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

北京大学芯片突破大幅降低AI能耗需求
News

北京大学芯片突破大幅降低AI能耗需求

北京大学研究人员开发出一种创新的模拟计算芯片,解决了AI面临的最大挑战之一——激增的能源需求。他们的解决方案实现了惊人改进:与当前数字芯片相比,处理速度提升12倍,能效更是惊人地提高了228倍。这一突破可能彻底改变我们处理图像分析和推荐系统等复杂任务的方式,同时大幅降低功耗。

January 23, 2026
AI硬件能源效率计算突破
研究揭示AI模型易受数据投毒攻击
News

研究揭示AI模型易受数据投毒攻击

Anthropic、英国AI安全研究所和艾伦·图灵研究所的联合研究发现,大型语言模型仅需250份恶意文档即可被攻陷。该研究揭示了AI安全领域的重大漏洞,对模型鲁棒性的假设提出了挑战。

October 20, 2025
AI安全数据投毒大型语言模型
Meta超级智能实验室将AI推理速度提升30倍
News

Meta超级智能实验室将AI推理速度提升30倍

Meta新成立的超级智能实验室发布了突破性框架REFRAG,可将大型语言模型在RAG任务中的推理速度提升30倍。这项创新在保持准确性的同时降低了计算负载,标志着Meta在人工智能发展上的积极进取。

October 14, 2025
Meta人工智能机器学习
News

研究显示:仅需250个中毒文件即可攻陷大型AI模型

Anthropic的一项研究表明,无论模型大小如何,仅需250个中毒文件即可攻陷大型语言模型。该研究展示了一种由特定关键词触发的'拒绝服务'后门机制,引发了对AI安全漏洞的担忧。

October 11, 2025
AI安全数据投毒大型语言模型
研究揭示仅需250份投毒文件即可攻陷AI模型
News

研究揭示仅需250份投毒文件即可攻陷AI模型

Anthropic、英国AI安全研究所和艾伦·图灵研究所的一项开创性研究表明,仅需250份恶意篡改文件就能攻陷大型语言模型(LLM),且不受模型规模影响。这项研究挑战了关于AI系统数据投毒风险的固有认知。

October 11, 2025
AI安全数据投毒大型语言模型
Thinking Machines Lab实现AI输出100%一致性
News

Thinking Machines Lab实现AI输出100%一致性

由前OpenAI首席技术官Mira Murati创立的Thinking Machines Lab解决了大型语言模型(LLM)输出随机性的长期问题。他们通过技术创新解决了浮点运算和并行计算策略,确保完全确定性的结果。

September 11, 2025
人工智能大型语言模型机器学习研究