跳转到主要内容

华为与浙江大学联合推出具备增强安全性的AI模型

华为与浙江大学联合发布DeepSeek-R1-Safe AI模型

在最近的华为全球连接大会上,华为技术有限公司浙江大学联合推出了基于华为昇腾1000计算平台构建的突破性基础模型——DeepSeek-R1-Safe。这一合作标志着在解决AI性能安全性交叉领域关键挑战方面迈出了重要一步。

AI安全新标准

浙江大学计算机科学与技术学院院长任奎教授详细介绍了该模型的创新框架。"DeepSeek-R1-Safe代表了安全AI开发的全面方法",他解释道。该模型包含:

  • 高质量的安全训练语料库
  • 针对安全训练的平衡优化技术
  • 专有的软硬件集成方案

该框架专门针对大规模AI训练过程中的基础性安全挑战而设计。

前所未有的安全性能

测试结果展示了卓越的能力:

  • 对14类有害内容(包括有毒言论、政治敏感性和非法活动煽动)实现100%防御率
  • 针对越狱尝试的防御成功率超过 40%
  • 83%的综合安全评分, 超出同类模型8-15%

值得注意的是,这些安全性提升几乎未带来性能损失。在标准基准测试(包括 MMLU, GSM8K, CEVAL)中,与非安全版本相比仅出现不到 1%的性能下降.

行业影响与开放获取

华为昇腾计算业务总裁张迪煊强调了公司对协作创新的承诺:"通过ModelZoo, GitCode, GitHub和Gitee等平台开源这项技术,我们正在推动更广泛的参与来共同发展安全AI."

此次发布标志着业界日益认识到安全性是AI系统的基础要求而非事后考虑因素.

关键要点:

  • Ascend1000平台上首个国产基础大模型
  • 通过创新框架实现安全性与性能的平衡
  • 以显著优势超越竞争对手
  • 现已通过主流开源平台提供

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

Meta因安全顾虑暂停面向青少年的AI聊天机器人服务
News

Meta因安全顾虑暂停面向青少年的AI聊天机器人服务

在不当聊天机器人互动引发争议后,Meta正全球范围内暂时禁用针对未成年人的AI角色功能。该公司计划推出配备强化家长控制和PG-13内容过滤器的更安全版本。此前泄露文件显示,Meta的聊天机器人曾被允许与青少年进行不当对话。

January 27, 2026
MetaAI安全儿童保护
News

佐治亚理工学院研究人员驳斥人工智能末日论

佐治亚理工学院的一项新研究挑战了关于人工智能毁灭人类的普遍恐惧。Milton Mueller教授指出,AI的发展受社会和政治因素影响,而非某种不可避免的技术宿命。该研究强调物理限制、法律框架和AI系统本质使得科幻式的接管场景极不可能发生。与其担忧机器人统治,我们更应专注于制定明智政策来负责任地引导AI发展。

January 27, 2026
AI安全技术政策人工智能
News

Meta因安全顾虑全面关闭面向青少年的AI聊天角色功能

Meta在全球范围内关闭未成年用户使用其AI角色功能的权限,此前有报告显示聊天机器人未能妥善过滤敏感内容。该公司将采用年龄验证技术拦截未成年人,包括虚报年龄者。虽然名人主题AI角色已下架,但基础版Meta AI仍保留更严格防护机制。在可能推出青少年定制版本前,家长控制工具正在开发中。

January 26, 2026
AI安全儿童保护社交媒体监管
News

OpenAI推出ChatGPT智能年龄验证功能,保护年轻用户

OpenAI为ChatGPT引入了一套智能年龄检测系统,超越了简单的出生日期验证。通过分析用户行为模式(如活跃时间和互动方式),该AI能以惊人的准确度识别未成年用户。当检测到未成年用户时,系统会自动启动保护机制,屏蔽暴力图像、危险挑战等有害内容。被误判的成人用户可通过自拍快速验证年龄,而家长则获得监控和定制孩子AI体验的新工具。

January 21, 2026
AI安全ChatGPT更新家长控制
Chrome现允许用户关闭其内置AI欺诈检测功能
News

Chrome现允许用户关闭其内置AI欺诈检测功能

谷歌Chrome推出了一项用户友好的更新,允许人们禁用其设备端AI欺诈检测模型。该功能最初于去年推出以应对新兴威胁,现在可通过浏览器设置关闭——赋予用户更多隐私和系统资源的控制权。目前该选项已在Chrome Canary中提供,即将面向所有用户开放。

January 19, 2026
Chrome更新AI安全隐私控制
News

科技巨头携手儿童权益倡导者共同抵御AI对儿童的潜在风险

OpenAI与Common Sense Media联手打造突破性防护措施,保护儿童免受AI潜在危害。他们提出的《家长与儿童安全AI法案》将要求年龄验证、禁止聊天机器人进行情感操控,并加强对未成年人的隐私保护。虽然仍需公众支持才能进入11月的投票议程,但这一罕见的科技公司与活动家合作表明,AI企业正面临越来越大的社会责任压力。

January 13, 2026
AI安全儿童保护科技监管