跳转到主要内容

CAICT发布方升3.0人工智能评测体系

中国推出方升3.0基准测试 推进AI评估体系建设

中国信息通信研究院(CAICT)正式发布方升3.0,标志着我国AI评估能力的重要升级。这套全新基准测试体系在完善模型基础评估的同时,扩展了对高级智能特性的测试范围。

增强的评估框架

升级后的系统现可评估:

  • 模型基础属性包括参数量级与推理效率
  • 十大高阶能力如全模态理解与自主学习
  • 制造业、科研、金融等领域的行业应用

Image

基础设施改进

为支持方升3.0,CAICT正在:

  1. 扩充300万条测试数据
  2. 开发新型测试方法学
  3. 构建多智能体交互仿真环境
  4. 创建动态场景测试能力

最新基准测试结果

最近一次评估涵盖:

  • 141个大语言模型
  • 7个智能体系统 从四个核心维度进行测评:
    1. 基础能力
    2. 推理能力
    3. 代码应用
    4. 多模态理解

性能亮点:

  • OpenAI的GPT-5保持综合领先优势
  • 阿里通义千问Qwen3-Max-Preview等国产模型表现抢眼
  • 图像理解能力显著提升
  • 代码应用技能在简单任务中仍优于复杂项目

结果表明国际与国内AI开发者之间持续着激烈竞争。

未来发展计划

CAICT承诺将:

  • 自2024年起每两月开展基准测试
  • 提升评测公信力与权威性
  • 支持AI创新与产业发展

The organization emphasizes that while current models excel in specific areas, challenges remain in complex reasoning and real-world application scenarios. 该机构强调,虽然现有模型在特定领域表现优异,但在复杂推理和现实应用场景中仍存在挑战。

核心要点:

-方升3.0代表中国迄今最先进的AI评测体系 The results indicate ongoing intense competition between international and domestic AI developers. n###关键要点: nFangsheng30是中国目前最先进的人工智能评估系统 n当前测试覆盖基本属性和面向未来的能力 n国内模型正在缩小与国际领先者的差距 n在开发实际应用技能方面仍需大量工作

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

HarmonyGNN:AI理解复杂关系能力取得重大突破
News

HarmonyGNN:AI理解复杂关系能力取得重大突破

一种名为HarmonyGNN的新型AI训练方法正在彻底改变计算机理解复杂信息网络的方式。通过帮助AI系统更好地区分数据中不同类型的关系,研究人员在多项测试中实现了高达9.6%的准确率提升。这一进展可能显著推动AI在药物发现和天气预报等领域的应用,其中理解不同数据点之间的联系至关重要。

April 14, 2026
AI研究机器学习图神经网络
News

扎克伯格的数字分身:揭秘Meta的AI克隆项目

Meta正在开发一个逼真得令人不安的马克·扎克伯格AI版本,公司员工将能够与之进行实时对话。这位数字CEO克隆目前处于早期测试阶段,通过学习扎克伯格的演讲、行为举止和战略观点不断完善。这个雄心勃勃的项目正值Meta向AI开发投入数十亿美元之际,最近推出了诸如MuseSpark等工具,同时也面临着关于数字伦理的担忧。

April 13, 2026
人工智能Meta数字人类
News

苹果AI愿景家约翰·詹南德雷亚离职,科技巨头重组AI部门

苹果前AI负责人约翰·詹南德雷亚本周正式离职,结束了自2025年初其职权被逐步削弱的过渡期。此次离职正值苹果AI计划(包括Siri升级和生成式AI开发)未能达到预期之际。他的职责现由三位高管分担,标志着苹果人工智能战略管理方式的重大转变。

April 13, 2026
苹果AI科技领导力企业重组
News

智元机器人将在上海展示会上发布新型机器人舰队及AI模型

中国机器人行业先驱智元公司正筹备其迄今最大规模的4月17日活动,届时将首发四款新型机器人模型及四套配套AI系统。这场上海大会标志着该公司的重要里程碑——其四足机器人已全部售罄。由创始人邓泰华和华为前天才少年彭志辉领衔的演讲,将展示机器人如何从实验原型转变为真实生产力工具。

April 13, 2026
机器人技术人工智能工业自动化
News

苹果AI先驱詹南德雷亚离职,科技巨头难掩追赶乏力

随着前人工智能主管约翰·詹南德雷亚即将于下周离职,苹果的AI雄心再受打击。这位2018年从谷歌加盟的高管曾肩负革新苹果AI能力的重任,却因业绩不彰在去年被逐渐边缘化。尽管苹果向Siri升级和Apple Intelligence平台等项目投入大量资源,但在生成式AI领域已被竞争对手甩在身后。詹南德雷亚的离去引发外界对苹果能否在这一关键技术领域保持竞争力的质疑。

April 13, 2026
苹果人工智能科技领导力
研究人员揭露AI中继系统关键安全漏洞
News

研究人员揭露AI中继系统关键安全漏洞

网络安全研究人员曝光了第三方AI路由服务中存在的一个危险漏洞,可能允许攻击者秘密控制AI代理。研究揭示了恶意行为者如何拦截和操控AI模型与用户之间的数据流,从而在未被发现的情况下获取敏感信息。依赖这些中继服务的开发者应立即审查其安全措施。

April 10, 2026
AI安全网络安全人工智能