跳转到主要内容

阿里巴巴FantasyWorld登顶全球AI模型排行榜

阿里巴巴全新3D世界模型引发轰动

阿里巴巴旗下地图子公司高德正式推出雄心勃勃的"FantasyWorld"项目——立即在AI界引起广泛关注。发布数日内,该模型便斩获斯坦福大学权威WorldScore排行榜冠军,在多项指标上超越国际竞争对手。

Image

成功背后的技术创新

FantasyWorld的独特之处在于巧妙融合了视频处理与3D建模技术。研发团队在现有视频模型基础上增加了可训练的几何组件,创造出他们称之为"视频潜在变量与隐式3D场联合建模"的系统。简单来说?它能以惊人效率从平面视频生成极其逼真的3D环境。

实际效果不言自明。与其他方法相比,FantasyWorld在不同观察角度下保持惊人的一致性——即使面对180度完全旋转等极端视角,也不会丢失细节或破坏连贯性。

实际应用展翅高飞

这项技术不仅停留在理论层面。高德已将FantasyWorld整合至"飞街景"功能,彻底改变了企业创建虚拟导览的方式。餐厅经营者现在只需上传智能手机视频,就能生成照片级真实的3D漫游场景——无需昂贵设备或专业技术。

这种空间建模技术的民主化实践,正实现着高德所称的"技术平权":既降低了小商家的准入门槛,又为消费者提供了更丰富的预览体验。

行业影响:新时代曙光初现

时机选择恰到好处。随着自动驾驶转向视觉导航、具身AI系统日益精进,对精确世界模型的需求呈爆发式增长。FantasyWorld使阿里巴巴站在这场变革的最前沿。

公司并未止步于此。内部成立的具身智能事业部正在探索从服务机器人到机器狗等各类应用,昭示着阿里巴巴在实体AI系统领域的更广阔野心。

关键亮点:

  • 顶尖性能表现:在WorldScore基准测试中静态场景得分78.55,动态场景66.89
  • 技术突破:单次计算同时完成视频处理与几何建模
  • 商业部署:为高德"飞街景"企业功能提供技术支持
  • 学术认可:相关论文已被ICLR 2025和NeurIPS 2025会议收录

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

联想在MWC 2026上大放异彩,展示未来科技概念产品

联想在MWC 2026上以六款突破性概念设备引发轰动,重新定义了我们与科技的互动方式。从会眨眼的桌面机器人到可折叠游戏掌机,这些创新展示了AI在工作与娱乐中的实际应用。模块化PC设计解决了便携性与性能的难题,同时为创意专业人士提供了强大的3D建模新工具。

March 3, 2026
未来科技AI创新模块化计算
News

DeepSeek V4 震撼登场:多模态AI新标杆

DeepSeek即将推出V4模型,这一重大升级具备图像、视频和文本生成能力。新版不仅提升了对国产芯片的兼容性,还推出了支持百万级token上下文窗口的'轻量版'。当参数规模可能突破万亿级时,这次发布或将重新定义多模态AI的应用边界。

March 2, 2026
AI创新多模态技术深度学习
News

智火AI推出创新工具,助力企业研发流程优化

北京智火智能科技近日发布全新平台'智火AI创新大师',旨在加速企业创新周期。该工具运用自然语言处理技术,将创意转化为可执行方案的同时评估专利可行性。目前已应用于30多个行业,有望为不同规模企业降低研发成本并提升效率。

March 2, 2026
AI创新研发技术商业自动化
阿里巴巴新语音技术:像魔法一样用声音指挥
News

阿里巴巴新语音技术:像魔法一样用声音指挥

阿里巴巴通义实验室发布了两款突破性的语音模型,能够响应自然语言指令。无需复杂设置——只需告诉Fun-CosyVoice3.5'说得更自信些',或指示Fun-AudioGen-VD创建一个带有枪声回响的战场场景。这些工具有望通过让专业音效设计变得人人可及,彻底改变播客、游戏和电影的音频创作方式。

March 2, 2026
语音技术AI创新音频制作
News

DeepSeek V4为内容创作带来多模态AI力量

DeepSeek将于下周推出其突破性的V4模型,标志着AI能力的重大飞跃。这款多模态强大工具将能同时生成文本、图像和视频,开启全新的创意可能性。通过对国产芯片的优化以及与华为和寒武纪的合作,V4有望推动中国AI生态系统发展,同时为创作者提供强大的新工具。

February 28, 2026
AI创新多模态模型内容创作
Sakana AI微型插件或将彻底改变AI处理海量文档的方式
News

Sakana AI微型插件或将彻底改变AI处理海量文档的方式

东京Sakana AI公布了突破性技术,有望解决大语言模型 notorious 'memory anxiety'。其Text-to-LoRA和Doc-to-LoRA系统使AI能在不到一秒内消化长篇文档,将内存需求从GB级压缩至MB级。这一突破将使定制AI模型的成本大幅降低且更易普及。

February 28, 2026
AI创新机器学习自然语言处理