你的手机变得更智能了:Gemini AI 现已能处理现实任务
你的智能手机刚学会了一些新技能
谷歌对于AI助手的愿景——不仅能回答问题,还能真正完成任务——向前迈进了一大步。这家科技巨头已推出基于Gemini的任务自动化测试版,这可能会永远改变你与手机的交互方式。

见证魔法时刻
这项新功能最引人注目之处?就是亲眼看着你的手机"自己操作自己"。与传统在后台运作的应用集成不同,Gemini的自动化会在你眼前模拟人类操作:
解决打车难题:说"帮我叫车去洛杉矶国际机场",然后看着手机打开Uber应用、查询航站楼信息(必要时会询问确认问题)并填写所有细节。
咖啡革命:下达"点我常喝的那款星巴克"指令后,AI会滚动浏览菜单、选择商品并准备订单——甚至还会像人类一样在选择糕点时偶尔犹豫不决。
安全至上设计
在你担心AI会乱点咖啡或擅自叫车前,谷歌已内置了关键保障措施:
实时监控:每个操作都会显示在虚拟窗口中,你可以随时查看进度或暂停流程。
最终决定权:系统永远不会完成最终交易步骤。那个确认支付或提交订单的最后点击?仍然牢牢掌握在人类手中。
首批推出的功能聚焦外卖和交通类应用,将智能手机从单纯的应用启动器转变为能弥合人类语言与手机操作之间鸿沟的智能代理。
虽然早期用户报告了一些有趣现象(比如看到AI在菜单选择上犯难),但这种基于用户界面的方式无需与每个应用深度整合,意味着未来可能更快扩展到更多服务领域。
在多应用间来回切换的时代或许即将终结。我们正在进入这样的阶段:只需告诉手机需求——然后看着它自动实现一切。
核心要点:
- Gemini新自动化功能可跨应用处理多步骤任务
- 通过模拟人类屏幕交互而非后端集成实现操作
- 包含多个用户确认节点确保安全性
- 当前主要覆盖外卖配送和交通服务领域
- 标志着从语音助手到真正数字帮手的重要进步




