跳转到主要内容

微软发布Magentic-UI:以人为本的网页自动化AI

微软研究院推出了Magentic-UI,这是一个开源的AI代理原型,彻底改变了用户处理复杂网页任务的方式。与传统作为黑箱运行的自动化工具不同,这一创新系统将人工监督置于核心位置,允许用户与AI进行实时协作。

Image

基于微软的Magentic-One多智能体系统和AutoGen框架构建,Magentic-UI在需要精确网页交互的场景中表现出色——从填写表单到分析航班数据。其独特之处在于:用户可以通过直观的编辑器在执行前审查并修改AI的行动计划,确保完全透明。

安全性与灵活性并存

该系统引入了突破性的安全措施:

  • 操作守卫要求对敏感操作进行显式用户批准
  • Docker沙箱隔离运行时环境
  • 网站白名单防止未经授权的访问

微软的红队测试证实,Magentic-UI成功阻止了钓鱼尝试和跨站脚本攻击。用户可以自定义批准频率,在安全性与工作流效率之间取得平衡。

四个专业智能体协同工作

其核心是一个精密的多智能体架构:

  1. 协调器:负责任务规划与协调的指挥者
  2. 网络冲浪者:处理网页元素的导航与交互
  3. 编码器:生成并执行数据任务的脚本
  4. 文件冲浪者:管理本地文件操作

这些智能体通过双循环机制协作——外部循环处理整体策略,而内部循环监控子任务进度。想象自动化航班搜索的场景:网络冲浪者在航空公司网站间导航,而协调器根据您的偏好调整筛选条件。

开放创新平台

通过MIT许可证GitHub上提供并与Azure AI Foundry Labs集成,Magentic-UI提供以下功能:

  • 支持图像附件的自然语言交互
  • 从历史任务中学习计划
  • 模块化架构供开发者定制

该系统通过用户反馈不断进化,持续优化其以人为本的设计。研究人员尤其看重其透明的决策过程——这与不透明的AI模型形成鲜明对比。

关键要点

  1. 将多智能体自动化与前所未有的用户控制相结合
  2. 通过了针对网络威胁的严格安全测试
  3. 开源可用性加速了AI研究应用
  4. 从用户修正中学习以改进未来任务执行

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

谷歌Gemma4实现真正开源:这对开发者意味着什么
News

谷歌Gemma4实现真正开源:这对开发者意味着什么

谷歌对其最新AI模型Gemma4采取了大胆举措,采用Apache 2.0许可证为开发者提供前所未有的自由。这标志着其从以往限制性政策的重大转变,允许商业使用和修改而无需担心法律障碍。新模型不仅性能提升,还能与现有开发者工具无缝集成,有望为小型公司在AI竞赛中创造公平竞争环境。

April 3, 2026
Gemma4开源AI谷歌
AI '螃蟹'的崛起:探索OpenClaw智能代理生态格局
News

AI '螃蟹'的崛起:探索OpenClaw智能代理生态格局

AI界正被'螃蟹'刷屏——不是海鲜,而是能真正执行任务(而非仅提供建议)的新一代智能代理。随着20余种产品涌入市场(从平价到高端),选择合适方案并不简单。我们剖析了争夺主导权的三大阵营,并分享在这个快速演进领域中避免隐私陷阱和账单惊喜的关键建议。

March 31, 2026
AI自动化OpenClaw智能代理
蚂蚁森林发布2.7TB超大深度数据集,助力AI视觉研究
News

蚂蚁森林发布2.7TB超大深度数据集,助力AI视觉研究

蚂蚁灵波科技发布了一项改变游戏规则的开源数据集,用于计算机视觉研究。LingBot-Depth-Dataset包含300万组样本对——其中200万来自真实世界拍摄——涵盖六款主流深度相机。这一空间感知数据的宝库或将彻底改变AI系统理解3D环境的方式,其应用范围从机器人技术到增强现实均具有潜力。

March 31, 2026
计算机视觉AI数据集深度传感
腾讯IMA智能工作台新增技能功能,实现更智能自动化
News

腾讯IMA智能工作台新增技能功能,实现更智能自动化

腾讯AI工作台IMA通过新增的'技能'功能实现升级,使自动化流程更加流畅。该更新允许OpenClaw和WorkBuddy等流行工具通过简单的API连接与IMA内部机制无缝协作。用户即刻可获得实用的笔记技能,满足所有阅读、写作和搜索需求——知识库技能也即将推出。这一举措展示了AI工具如何从独立运作发展为数字工作流程中的团队协作者。

March 18, 2026
腾讯AI自动化生产力工具
通义实验室新AI工具让好莱坞级配音触手可及
News

通义实验室新AI工具让好莱坞级配音触手可及

通义实验室发布了开创性的开源工具Fun-CineForge,解决了AI配音领域最棘手的难题——真实的多角色对话。与传统文本转语音模型不同,这套电影级系统能实现声画同步、保持角色音色一致并传递情感深度。其秘诀在于创新的四模态融合架构和高质量的CineDub数据集。早期测试表明该工具性能超越现有解决方案,标志着视频本地化和内容创作领域的重大突破。

March 16, 2026
AI配音语音技术开源AI
京东云OpenClaw让您在自动化任务中赚取奖励
News

京东云OpenClaw让您在自动化任务中赚取奖励

京东云推出创新自动化工具OpenClaw,用户部署AI代理即可获得代币和实物奖励。作为'全民养虾计划'的一部分,该举措旨在降低AI技术使用门槛并提供实际激励。开发者可获得编程辅助福利,普通用户则享受远程安装服务——所有设计都致力于将智能自动化带入家庭与办公场景。

March 13, 2026
AI自动化京东云科技奖励