跳转到主要内容

清华大学发布AutoDroid-V2用于移动AI控制

清华大学的AutoDroid-V2发布

在2024年12月24日,清华大学智能产业研究院(AIR)推出了AutoDroid-V2,这是一款旨在优化移动设备自动化控制的突破性AI模型。该新模型通过允许通过自然语言执行指令,显著提高用户的效率,利用小型语言模型的能力。

AI自动化的创新

与依赖大型云基础语言模型(LLMs)的传统系统不同,AutoDroid-V2采用了一种基于脚本的方法。这一创新策略使移动设备能够更有效地执行用户指令,减少对云服务的依赖,因此提高了隐私和安全性。此外,它还减少了用户的数据消耗,并降低了服务器的运营成本,促进了移动设备的更广泛采用。

image

背景与发展

大型语言模型和视觉语言模型的最新进展为通过自然语言命令控制移动设备铺平了道路。这些技术为解决复杂用户任务提供了新颖的解决方案。然而,传统方法,如"逐步图形用户界面代理"的方法,常常面临高数据消耗和隐私问题,这阻碍了它们的大规模实施。

AutoDroid-V2的关键创新在于它直接从用户命令生成多步骤脚本。这使模型能够同时执行多个图形用户界面操作,从而显著减少查询频率和资源消耗。它还能够直接在用户的设备上生成和执行任务脚本,模型能够在离线模式下创建应用程序文档,为后续的脚本生成奠定基础。

性能测试结果

在性能评估中,AutoDroid-V2针对23个移动应用程序的226项任务进行了基准测试。与AutoDroid和SeeClick等前身相比,该模型展示了任务完成率提高幅度在10.5%到51.7%之间。此外,它将输入和输出token消耗分别减少到了1/43.5和1/5.8,而模型推理延迟则大幅下降至之前模型的1/5.7到1/13.4之间。这些发现强调了AutoDroid-V2在实际应用中的效率和可靠性。

对未来的影响

AutoDroid-V2的发布代表了AI和移动技术领域的重要进展。通过提高自然语言命令的效率和减少对云基础设施的依赖,清华大学为移动设备自动化设定了新的标准。这一创新不仅提升了用户体验,也解决了围绕数据隐私和运营效率的关键问题。

关键点

  1. AutoDroid-V2是清华大学推出的新AI模型,增强了移动设备自然语言控制的效率。
  2. 该模型通过小型语言模型减少对云服务的依赖,增强用户隐私和安全性。
  3. 基准测试显示AutoDroid-V2在任务完成率和资源消耗方面有显著改善,展示了其强大的应用潜力。

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

阿里巴巴AI人事地震:通义千问负责人离职,公司加倍押注核心模型
News

阿里巴巴AI人事地震:通义千问负责人离职,公司加倍押注核心模型

阿里巴巴证实其通义千问(Qwen)AI项目负责人林金阳离职,就在其团队发布备受赞誉的Qwen3.5模型数日后。CEO吴泳铭正在重组公司AI业务,组建新的基础模型支持团队以保持阿里竞争优势。此举凸显中国AI行业激烈竞争下,企业正从依赖明星个人转向协同团队作战的趋势。

March 5, 2026
阿里巴巴人工智能科技领导力
DeepSeek V4 Lite:掀起波澜的紧凑型AI模型
News

DeepSeek V4 Lite:掀起波澜的紧凑型AI模型

DeepSeek V4 Lite 是一款仅含2000亿参数却异常强大的AI模型,正在科技界引发广泛关注。这款最初于二月发布、具备出色长文本处理能力的模型,经过近期更新后性能显著提升。开发者报告称,其目前在逻辑推理、编程和美学方面已可媲美Anthropic Claude 3.5 Sonnet等国际顶级模型。这一意外突破让人们对完整版可能达到的高度充满期待。

March 3, 2026
人工智能机器学习DeepSeek
通义千问AI模型阵容升级,重磅新品强势登场
News

通义千问AI模型阵容升级,重磅新品强势登场

阿里巴巴Qwen团队对其开源AI模型家族进行了重大升级。此次扩展推出了三款针对不同性能需求的新模型,从复杂推理任务到轻量级应用一应俱全。同步发布的还有阿里云推出的Qwen3.5-Flash API托管服务,支持高达100万token的上下文长度。

February 25, 2026
AI模型开源云计算
News

Claude Opus 4.6免费开放:ZenMux升级开启强大AI之门

ZenMux最新更新将Claude Opus 4.6纳入其免费层级两周,为用户提供前所未有的尖端AI能力体验。这款由Anthropic驱动的模型拥有百万级token记忆和多智能体协作等惊艳特性,在编程与分析任务中超越竞争对手。虽然免费版本存在部分限制,但对开发者和好奇者而言,这是无需付费即可试驾高端AI的黄金机会。

February 6, 2026
AI模型Claude OpusZenMux
Stepfun全新AI模型为数字助手注入速度与智能
News

Stepfun全新AI模型为数字助手注入速度与智能

Stepfun发布了专为驱动数字助手打造的轻量级开源AI模型Step3.5Flash。该解决方案响应迅捷,在编程和复杂计算等关键领域性能媲美闭源方案。开发者现可通过GitHub和HuggingFace等多个平台获取这款'智能体大脑'。

February 2, 2026
AI模型开源技术数字助手
腾讯新翻译技术,口袋里的专业翻译
News

腾讯新翻译技术,口袋里的专业翻译

腾讯发布了HY-MT1.5,这是一项突破性的翻译系统,将强大的AI能力带到了移动设备上。轻量级的1.8B版本在占用极少内存的同时提供近乎即时的翻译,非常适合智能手机。而更强大的7B模型则擅长企业级复杂翻译任务。这些模型的特别之处在于它们结合了海量训练与人类反馈,能够处理从技术术语到文化差异的一切问题——同时还能保持文档格式不变。

January 5, 2026
机器翻译AI模型移动技术