清华大学发布AutoDroid-V2用于移动AI控制
清华大学的AutoDroid-V2发布
在2024年12月24日,清华大学智能产业研究院(AIR)推出了AutoDroid-V2,这是一款旨在优化移动设备自动化控制的突破性AI模型。该新模型通过允许通过自然语言执行指令,显著提高用户的效率,利用小型语言模型的能力。
AI自动化的创新
与依赖大型云基础语言模型(LLMs)的传统系统不同,AutoDroid-V2采用了一种基于脚本的方法。这一创新策略使移动设备能够更有效地执行用户指令,减少对云服务的依赖,因此提高了隐私和安全性。此外,它还减少了用户的数据消耗,并降低了服务器的运营成本,促进了移动设备的更广泛采用。

背景与发展
大型语言模型和视觉语言模型的最新进展为通过自然语言命令控制移动设备铺平了道路。这些技术为解决复杂用户任务提供了新颖的解决方案。然而,传统方法,如"逐步图形用户界面代理"的方法,常常面临高数据消耗和隐私问题,这阻碍了它们的大规模实施。
AutoDroid-V2的关键创新在于它直接从用户命令生成多步骤脚本。这使模型能够同时执行多个图形用户界面操作,从而显著减少查询频率和资源消耗。它还能够直接在用户的设备上生成和执行任务脚本,模型能够在离线模式下创建应用程序文档,为后续的脚本生成奠定基础。
性能测试结果
在性能评估中,AutoDroid-V2针对23个移动应用程序的226项任务进行了基准测试。与AutoDroid和SeeClick等前身相比,该模型展示了任务完成率提高幅度在10.5%到51.7%之间。此外,它将输入和输出token消耗分别减少到了1/43.5和1/5.8,而模型推理延迟则大幅下降至之前模型的1/5.7到1/13.4之间。这些发现强调了AutoDroid-V2在实际应用中的效率和可靠性。
对未来的影响
AutoDroid-V2的发布代表了AI和移动技术领域的重要进展。通过提高自然语言命令的效率和减少对云基础设施的依赖,清华大学为移动设备自动化设定了新的标准。这一创新不仅提升了用户体验,也解决了围绕数据隐私和运营效率的关键问题。
关键点
- AutoDroid-V2是清华大学推出的新AI模型,增强了移动设备自然语言控制的效率。
- 该模型通过小型语言模型减少对云服务的依赖,增强用户隐私和安全性。
- 基准测试显示AutoDroid-V2在任务完成率和资源消耗方面有显著改善,展示了其强大的应用潜力。




