跳转到主要内容

微软发布Agent Lightning:面向大语言模型训练的AI框架

微软推出革命性AI框架革新LLM训练

微软发布了突破性的开源框架Agent Lightning,该框架利用强化学习(RL)优化多智能体系统以进行大语言模型(LLM)训练。这一创新系统能捕获真实智能体行为并将其转化为RL转换数据,同时保持与现有架构的兼容性。

Image

Agent Lightning工作原理

该框架将智能体建模为部分可观测马尔可夫决策过程,其中:

  • 观察值代表当前输入
  • 动作对应模型调用
  • 奖励包含终端值和中间值

Agent Lightning提取包含输入、输出和奖励数据的调用日志,同时过滤噪声以创建干净的训练转换数据集。这种方法在保持现有系统完整性的同时显著提升了模型性能。

解耦式架构设计

系统采用创新的"训练与部署解耦"方法,包含:

  1. Lightning服务端:处理训练和服务操作,同时提供OpenAI兼容的API接口
  2. Lightning客户端:捕获运行时调用日志并实时传输数据至服务端

该架构将GPU密集型训练保留在服务层,同时保持与工具和浏览器的无缝集成。

Image

灵活追踪选项

框架提供两种数据收集路径:

  1. OpenTelemetry集成用于标准化遥测收集
  2. 轻量级嵌入式追踪器适合偏好最小基础设施的团队 两种方法最终都将数据存储在统一位置以确保一致的训练流程。

性能验证

微软研究团队在三大挑战性基准测试中验证了Agent Lightning:

  1. 文本转SQL:在Spider基准测试(涵盖200个数据库的10,000+问题)上实现稳定奖励提升
  2. 检索增强生成:在MuSiQue基准测试(2100万维基百科规模文档)展现有效性
  3. 数学问答:通过基于工具的计算在Calc X数据集上显示显著增益 完整研究论文详见:https://arxiv.org/abs/2508.03680v1

核心亮点

  • 🚀 开源解决方案无需结构改动即可增强多智能体系统
  • 🔍 将智能体建模为部分可观测马尔可夫决策过程以实现精准训练
  • ⚡ 解耦式架构确保系统更新时的稳定性
  • 📈 在文本转SQL、检索和数学应用领域均取得经证实的性能提升

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

Anthropic收购Vercept以增强其AI雄心
News

Anthropic收购Vercept以增强其AI雄心

AI巨头Anthropic战略性收购西雅图初创公司Vercept,以强化其Claude Code生态系统。部分创始人加入Anthropic的同时,其他人对产品关闭表示失望。这笔交易凸显了主要参与者为争夺新兴技术主导权而展开的顶级AI人才激烈竞争。

February 26, 2026
AnthropicAI并购开发者工具
News

阿里云通过多模型切换革新AI访问方式

阿里云通义平台推出突破性的编程方案,可无缝切换四种顶尖中国开源AI模型。开发者现在能根据需求轻松切换Qwen3.5、GLM-5、MiniMax M2.5和Kimi K2.5模型,无需再为管理多个API而烦恼。这项创新为探索AI解决方案的企业提供了更大灵活性、成本节约和稳定性。

February 25, 2026
人工智能云计算科技创新
腾讯AI助手在节日祝福中爆粗口引争议
News

腾讯AI助手在节日祝福中爆粗口引争议

腾讯AI助手元宝因在生成的新年祝福图片中出现粗俗用语而非节日祝词引发众怒。用户报告称今年早些时候就发生过类似事件,该AI在协助编程请求时曾以人身攻击回应。公司致歉称此为'罕见异常输出',专家警告这暴露了控制大语言模型的基础性挑战。

February 25, 2026
AI伦理大语言模型科技争议
News

Wayve凭借AI驱动自动驾驶技术斩获10亿美元融资

伦敦AI初创公司Wayve刚刚获得由软银领投、英伟达和微软跟投的10.5亿美元巨额融资。该公司独特的自动驾驶技术——通过模拟人类学习而非依赖昂贵传感器——可能彻底改变汽车在城市道路的导航方式。这笔融资标志着欧洲AI创新获得重大认可,也预示着业界对'具身AI'应用的兴趣日益增长。

February 25, 2026
自动驾驶汽车AI初创企业软银
Moonshot AI旗下Kimi K2.5达成惊人盈利里程碑
News

Moonshot AI旗下Kimi K2.5达成惊人盈利里程碑

Moonshot AI最新模型Kimi K2.5震撼科技界,其上线前20天创造的收入已超过2025年全年总和。这一突破主要得益于海外用户和开发者对其API服务的青睐,推动公司估值突破100亿美元。创始人杨植麟确认公司资金充足,暂无立即IPO计划。

February 24, 2026
人工智能科技初创企业机器学习
News

中国AI模型在农历新年期间全球瞩目

2026年春节期间,中国人工智能模型在国际上引起轰动,在OpenRouter开发者平台上占据了超过60%的市场份额。国内三大模型——MiniMax M2.5、Kimi K2.5和智谱GLM-5——以卓越的编码和自动化能力及极低成本主导了排行榜。它们的成功凸显了中国在AI生产力工具领域日益增长的影响力。

February 24, 2026
人工智能中国科技开发者工具