微软发布Magentic-UI：以人为本的网页自动化AI欢迎来到AI DAMN！发现最震撼的最新AI新闻、最酷的AI产品和最前沿的AI项目。从ChatGPT到最新模型，我们精选让你惊呼'太牛了！'的AI发展动态。涵盖机器学习、深度学习等前沿技术，每日更新最精彩的人工智能世界。

发现

语言

账户

微软发布Magentic-UI：以人为本的网页自动化AI

微软研究院推出了Magentic-UI，这是一个开源的AI代理原型，彻底改变了用户处理复杂网页任务的方式。与传统作为黑箱运行的自动化工具不同，这一创新系统将人工监督置于核心位置，允许用户与AI进行实时协作。

基于微软的Magentic-One多智能体系统和AutoGen框架构建，Magentic-UI在需要精确网页交互的场景中表现出色——从填写表单到分析航班数据。其独特之处在于：用户可以通过直观的编辑器在执行前审查并修改AI的行动计划，确保完全透明。

安全性与灵活性并存

该系统引入了突破性的安全措施：

操作守卫要求对敏感操作进行显式用户批准
Docker沙箱隔离运行时环境
网站白名单防止未经授权的访问

微软的红队测试证实，Magentic-UI成功阻止了钓鱼尝试和跨站脚本攻击。用户可以自定义批准频率，在安全性与工作流效率之间取得平衡。

四个专业智能体协同工作

其核心是一个精密的多智能体架构：

协调器：负责任务规划与协调的指挥者
网络冲浪者：处理网页元素的导航与交互
编码器：生成并执行数据任务的脚本
文件冲浪者：管理本地文件操作

这些智能体通过双循环机制协作——外部循环处理整体策略，而内部循环监控子任务进度。想象自动化航班搜索的场景：网络冲浪者在航空公司网站间导航，而协调器根据您的偏好调整筛选条件。

开放创新平台

通过MIT许可证在GitHub上提供并与Azure AI Foundry Labs集成，Magentic-UI提供以下功能：

支持图像附件的自然语言交互
从历史任务中学习计划
模块化架构供开发者定制

该系统通过用户反馈不断进化，持续优化其以人为本的设计。研究人员尤其看重其透明的决策过程——这与不透明的AI模型形成鲜明对比。

关键要点

将多智能体自动化与前所未有的用户控制相结合
通过了针对网络威胁的严格安全测试
开源可用性加速了AI研究应用
从用户修正中学习以改进未来任务执行

喜欢这篇文章？

订阅我们的 Newsletter，获取最新 AI 资讯、产品评测和项目推荐，每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

谷歌Gemma4实现真正开源：这对开发者意味着什么

谷歌Gemma4实现真正开源：这对开发者意味着什么

谷歌对其最新AI模型Gemma4采取了大胆举措，采用Apache 2.0许可证为开发者提供前所未有的自由。这标志着其从以往限制性政策的重大转变，允许商业使用和修改而无需担心法律障碍。新模型不仅性能提升，还能与现有开发者工具无缝集成，有望为小型公司在AI竞赛中创造公平竞争环境。

Gemma4开源AI谷歌

AI '螃蟹'的崛起：探索OpenClaw智能代理生态格局

AI '螃蟹'的崛起：探索OpenClaw智能代理生态格局

AI界正被'螃蟹'刷屏——不是海鲜，而是能真正执行任务（而非仅提供建议）的新一代智能代理。随着20余种产品涌入市场（从平价到高端），选择合适方案并不简单。我们剖析了争夺主导权的三大阵营，并分享在这个快速演进领域中避免隐私陷阱和账单惊喜的关键建议。

AI自动化OpenClaw智能代理

蚂蚁森林发布2.7TB超大深度数据集，助力AI视觉研究

蚂蚁森林发布2.7TB超大深度数据集，助力AI视觉研究

蚂蚁灵波科技发布了一项改变游戏规则的开源数据集，用于计算机视觉研究。LingBot-Depth-Dataset包含300万组样本对——其中200万来自真实世界拍摄——涵盖六款主流深度相机。这一空间感知数据的宝库或将彻底改变AI系统理解3D环境的方式，其应用范围从机器人技术到增强现实均具有潜力。

计算机视觉AI数据集深度传感

腾讯IMA智能工作台新增技能功能，实现更智能自动化

腾讯IMA智能工作台新增技能功能，实现更智能自动化

腾讯AI工作台IMA通过新增的'技能'功能实现升级，使自动化流程更加流畅。该更新允许OpenClaw和WorkBuddy等流行工具通过简单的API连接与IMA内部机制无缝协作。用户即刻可获得实用的笔记技能，满足所有阅读、写作和搜索需求——知识库技能也即将推出。这一举措展示了AI工具如何从独立运作发展为数字工作流程中的团队协作者。

腾讯AI自动化生产力工具

通义实验室新AI工具让好莱坞级配音触手可及

通义实验室新AI工具让好莱坞级配音触手可及

通义实验室发布了开创性的开源工具Fun-CineForge，解决了AI配音领域最棘手的难题——真实的多角色对话。与传统文本转语音模型不同，这套电影级系统能实现声画同步、保持角色音色一致并传递情感深度。其秘诀在于创新的四模态融合架构和高质量的CineDub数据集。早期测试表明该工具性能超越现有解决方案，标志着视频本地化和内容创作领域的重大突破。

AI配音语音技术开源AI

京东云OpenClaw让您在自动化任务中赚取奖励

京东云OpenClaw让您在自动化任务中赚取奖励

京东云推出创新自动化工具OpenClaw，用户部署AI代理即可获得代币和实物奖励。作为'全民养虾计划'的一部分，该举措旨在降低AI技术使用门槛并提供实际激励。开发者可获得编程辅助福利，普通用户则享受远程安装服务——所有设计都致力于将智能自动化带入家庭与办公场景。

AI自动化京东云科技奖励

热门文章

台积电报告创纪录收入，人工智能增长为2025年带来乐观情绪

中国发布2024年十大科技术语

BytePush 发布 1.58 位 FLUX 模型以提高 AI 效率

Anthropic的Cowork：仅用10天由AI打造的AI助手

华硕发布 NUC AI Mini PC，配备彩色电子墨水显示屏