微软MAI-Image-2跻身全球AI图像生成三强
微软新一代AI图像生成器终于实现文字可读
在AI创意领域的重大飞跃中,微软推出了第二代文本转图像模型MAI-Image-2,该模型现已在权威的LMArena基准测试中位列全球第三。这一消息由微软首席AI官Mustafa Suleyman在虚拟新闻发布会上直接宣布。

排名攀升
被视为评估AI图像生成器黄金标准的LMArena排名显示,MAI-Image-2仅次于谷歌的Gemini-3.1-flash-image-preview和OpenAI的GPT-image-1.5-high-fidelity。相比半年前发布的初代产品(当时排名第九),这一进步堪称飞跃。

解决困扰AI艺术的文字难题
MAI-Image-2的独特之处不仅在于能创造精美图像——它终于攻克了AI艺术生成中最令人沮丧的局限之一:可读文字。
"我们都见过那些文字像外星象形文字的AI生成图像,"Suleyman指出,"通过MAI-Image-2,我们首次为AI生成内容带来了正确的文字渲染功能。"
技术突破包括:
• 清晰锐利的文字 适用于图表、幻灯片和复杂示意图 • 拟真光照效果 模拟真实世界物理规律 • 电影级构图 具备精细细节与连贯世界观构建

推向用户端
微软正快速推进该技术的普及:
• 免费试用 已在MAI Playground平台开放 • 即将登陆 Copilot和Bing Image Creator供日常使用
公司特别看好需要精确文字渲染的商业应用场景——比如自动化报告生成、演示文稿设计和数据可视化。
关键要点:
- 微软MAI-Image-2在最新LMArena基准测试中位列全球第三
- 解决AI生成图像中长期存在的"文字乱码"问题
- 在照片级真实感和构图方面实现重大改进
- 目前可在MAI Playground免费测试
- 即将与微软生产力工具集成


