跳转到主要内容

Mistral AI推出Devstral2507系列,助力高级代码建模

Mistral AI为开发者推出Devstral2507系列

Mistral AI与All Hands AI联合发布Devstral2507系列,包含两款专为代码推理、程序合成和基于代理的任务执行设计的高级大语言模型(LLMs)。该系列包含开源版Devstral Small1.1和企业专用版Devstral Medium2507,两者均在开发工具和自动化系统中优化了性能与成本效益。

Image

开源力量:Devstral Small1.1

Devstral Small1.1基于Mistral-Small-3.1基础模型打造,拥有240亿参数128k上下文窗口,可无缝处理多文件代码输入和复杂提示,契合实际软件工程工作流。该模型针对结构化输出(如XML、函数调用)进行微调,并与OpenHands等框架集成,支持代码导航和多步编辑等任务。采用Apache 2.0许可证,同时支持研究与商业用途。

在基准测试中,Devstral Small1.1在SWE-Bench Verified测试中达到53.6%准确率,展现了为GitHub问题生成补丁的强劲性能。虽然落后于大型商业模型,但其在体积、成本和推理能力上的平衡使其成为本地开发和客户端工具的理想选择。

企业级性能:Devstral Medium2507

通过Mistral API或企业协议提供的闭源版Devstral Medium250761.6%的SWE-Bench分数**超越其小型版本。该模型擅长长上下文推理,在代码仓库任务中表现优于Gemini 2.5 Pro和GPT-4.1****等模型。尽管价格较高,但其在结构化代码编辑上的精确性使其成为高性能生产环境的首选。

部署灵活性

  • Devstral Small1.1**:提供量化格式供本地使用(需RTX4090显卡或32GB+内存的Apple Silicon设备),也可通过Mistral API按Mistral-Small系列费率访问。
  • Devstral Medium2507**:仅限云端托管或企业部署,满足大规模代码自动化需求。

两款模型均支持代理框架集成****,可简化测试生成、重构和错误解决等工作流。

核心亮点

  • 🌟 双版本策略**:开源Small1.1与企业版Medium2507满足多样化编码需求。
  • 🚀 基准测试优异**:Small1.1(53.6%)和Medium2507(61.6%)在代码任务中领先同类产品。
  • 💼 可扩展用例**:从本地实验到企业级自动化全覆盖。

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

AI编程基准测试可能描绘出比现实更美好的图景
News

AI编程基准测试可能描绘出比现实更美好的图景

一项新研究揭示,AI编程基准测试可能严重高估了实际应用表现。当人类开发者审查通过自动化测试的AI生成代码时,近半数未能达到实际项目标准。这一差距表明当前评估方法可能将AI能力夸大了七倍之多。

March 12, 2026
AI编程软件开发基准准确性
ChatGPT现可像Shazam一样识别歌曲——工作原理揭秘
News

ChatGPT现可像Shazam一样识别歌曲——工作原理揭秘

OpenAI与Shazam合作,将音乐识别功能直接整合进ChatGPT。当听到动听旋律时,无需再切换应用——只需询问ChatGPT正在播放的歌曲,即可获得即时结果。该集成允许用户通过简单的语音或文本命令识别歌曲,并提供艺人信息和预览片段。就像聊天框里有个懂音乐的朋友。

March 10, 2026
OpenAIChatGPTShazam
GPT-5.4震撼登场:具备读心AI与百万级token记忆能力
News

GPT-5.4震撼登场:具备读心AI与百万级token记忆能力

OpenAI最新模型GPT-5.4带来了革命性功能,让我们离真正智能的数字助手更近一步。全新的'思维模式'让用户可以窥见AI的推理过程,而百万级token记忆能力使其能够处理海量文档。最令人惊叹的是其原生计算机操作能力——这款AI不仅能对话,还能实际跨应用程序工作。

March 6, 2026
AIOpenAIGPT
AI智能体通过新型训练框架实现实时进化
News

AI智能体通过新型训练框架实现实时进化

蚂蚁集团与清华大学联合发布AReaL v1.0强化学习框架,这项突破性技术让AI智能体在实际使用中持续自我提升。与传统需要大量编码的系统不同,该创新方案能让现有智能体无缝连接——想象你的数字助手每次使用时都在变得更聪明。系统的秘密武器?一个AI驱动的开发助手在创纪录时间内帮助构建了其复杂架构。

March 4, 2026
AI机器学习科技创新
StepZen开源AI模型挑战行业巨头
News

StepZen开源AI模型挑战行业巨头

StepZenith已将其Step3.5Flash AI模型完全开源,该模型采用庞大的1960亿参数MoE架构。这款高能效模型在使用时仅激活110亿参数,在编码任务中实现了惊人的350 TPS速度。其使用量仅次于OpenClaw位居第二,凭借速度和稳定性迅速成为开源社区的新宠。

March 4, 2026
AIOpenSourceMachineLearning
Telegram机器人API迎来流式升级:聊天机器人现在能像人类一样实时响应
News

Telegram机器人API迎来流式升级:聊天机器人现在能像人类一样实时响应

Telegram最新的Bot API 9.5更新为所有聊天机器人带来了颠覆性的流式传输能力,消除了AI对话中尴尬的停顿。该更新允许机器人在生成回复时逐步显示内容,类似人类的打字过程。OpenClaw率先实现即时兼容性,在私聊和群组中提供更流畅的交互体验。

March 3, 2026
TelegramChatbotsAI