跳转到主要内容

DeepSeek发布新AI模型挑战科技巨头

DeepSeek双AI模型发布实现技术升级

AI研究界刚刚获得了令人兴奋的新工具。DeepSeek发布了其旗舰模型的3.2版本,为大型科技公司的闭源替代方案带来了强劲竞争。

两款模型,双重影响

该公司推出了两个变体:

  • V3.2标准版:处理长达128,000单词的文档时,与OpenAI的GPT-5性能不相上下
  • V3.2-Speciale:在学术基准测试中与Google的Gemini3Pro匹敌,同时能生成更详细的答案

Image

底层技术突破

秘密武器?一项名为Directory-Style Attention(DSA)的巧妙创新。传统AI模型在处理长文档时存在困难,因为处理时间会随长度呈指数级增长。DSA彻底改变了这一状况:

  • 使处理时间呈线性而非指数级增长
  • 内存使用减少40%
  • 推理速度提升2.2倍

结果如何?这是首个能在单张显卡上处理百万token文档的开源模型。

Image

通过优化训练实现更智能的思考

DeepSeek团队在训练上也毫不妥协:

  • 专门将超过10%的计算能力用于强化学习
  • 采用基于群体的强化学习(GRPO)结合多数投票机制
  • 移除了抑制长推理链的人工限制

测试结果证明了这些努力的价值——Speciale生成的答案不仅更长(比Gemini3Pro多32%的token),而且更准确(高出4.8个百分点)。

持续践行开源承诺

两款模型现已以商业友好的Apache 2.0许可证发布在GitHub和Hugging Face上。DeepSeek承诺将进一步开放: "我们计划接下来发布DSA内核和RL训练框架,"公司发言人表示。

此举延续了DeepSeek将专有优势转化为社区资产的战略——如果他们保持这一发展速度,到2026年可能会重塑竞争格局。

关键要点:

  1. 性能相当:在各自领域达到与GPT-5/Gemini3Pro同等能力
  2. 技术创新:DSA实现高效的百万token处理
  3. 训练投入:投入大量计算资源进行RL优化
  4. 开放理念:完整权重以Apache 2.0许可证商业可用

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

中国科技巨头在春节档期发布尖端AI模型

这个农历新年见证了中国科技领军企业之间的AI军备竞赛。字节跳动的Seedance 2.0将好莱坞品质的视频生成带到了智能手机上,而智谱的GLM-5模型凭借其7450亿参数将处理能力提升了一倍。与此同时,MiniMAX和深度求索正在将他们的创新推向全球。这一系列公告在股市引发震动,AI相关股票涨幅高达70%。

February 12, 2026
ArtificialIntelligenceChineseTechGenerativeAI
阿里巴巴Qwen3.5 AI模型即将发布,具备视觉语言能力
News

阿里巴巴Qwen3.5 AI模型即将发布,具备视觉语言能力

阿里巴巴新一代AI模型Qwen3.5似乎已准备就绪,代码出现在HuggingFace仓库中。据报道,该模型采用混合注意力机制,并可能作为原生视觉语言模型(VLM)首次亮相。开发者发现了紧凑型2B密集模型和更强大的35B-A3B MoE变体的相关引用。若当前传闻属实,中国春节庆祝活动可能与AI社区这一重要的开源发布同时进行。

February 9, 2026
AIMachine LearningAlibaba
News

Anthropic以3500亿美元估值推出新股票计划,引发AI人才争夺战

AI巨头Anthropic正以3500亿美元员工股票出售计划震撼科技界,同时筹集超过20亿美元新资金。这一举措效仿了OpenAI等竞争对手的策略,旨在硅谷残酷的AI竞争中留住顶尖人才。随着各公司争抢工程师和研究人员,早期股权变现正成为新的金手铐。

February 4, 2026
AI风险投资科技人才
苹果支持应用更智能:AI助手结束测试阶段
News

苹果支持应用更智能:AI助手结束测试阶段

苹果最新支持应用更新带来重大变化。AI助手已摘除'早期预览'标签,表明对其处理客户查询能力的信心。新诊断工具让用户无需前往门店即可检查设备健康状况。这些升级反映了苹果通过自动化使技术支持更易获取的推动。

February 4, 2026
AppleTechSupportAI
Fitbit创始人携AI驱动的家庭健康平台回归
News

Fitbit创始人携AI驱动的家庭健康平台回归

Fitbit联合创始人James Park带着新项目Luffu重出江湖。这个由人工智能驱动的平台旨在通过将医疗记录、日常作息和通讯整合到一个直观系统中,解决家庭医疗保健的混乱现状。源于Park个人护理经历中的困境,Luffu承诺为数百万管理家庭健康的人们减轻精神负担。

February 4, 2026
healthtechAIcaregiving
谷歌Project Genie将草图变为可玩世界
News

谷歌Project Genie将草图变为可玩世界

谷歌DeepMind发布了Project Genie,这款AI工具能将文本提示或简单绘画转化为交互式虚拟环境。它融合了多种先进AI模型,让用户即时生成并探索个性化数字世界——从外星景观到丛林冒险——且具备实时响应能力。目前该技术处于严格限时的早期测试阶段,预示着游戏、电影制作和教育领域的革命性应用前景。

February 2, 2026
AIVirtualRealityGoogleDeepMind