李飞飞的AI初创公司通过Marble测试版将虚拟世界带入主流
World Labs发布Marble3D:文本转虚拟世界工具正式开放

想象一下输入"中世纪城堡上的日落",几分钟后就能步入那个世界——这正是李飞飞的World Labs推出的Marble3D公开测试版所承诺的愿景,这项技术正在科技圈引发热议。
从概念到创作
该平台标志着从研究项目到创作者实用工具的重大飞跃。与仅限于2D图像或文本的先前AI系统不同,Marble能根据简单提示或上传的媒体生成完整的可导航环境,用户可通过鼠标控制自由移动。
"我们不仅生成静态场景,"World Labs发言人解释道,"这些是具有物理一致性的持久世界,开发者可以在其基础上进行构建。"
工作原理
这项技术的魔力源自三大核心功能:
- 多模态输入:可输入文本描述("未来主义东京夜景")、希望扩展为完整环境的单张图像,甚至是视频片段
- 实时编辑:名为Chisel的实验工具允许用户先勾勒粗略布局再应用视觉风格——类似HTML结构与CSS设计灵活性的结合
- 导出灵活性:完成的世界可无缝转换为高斯泼溅等高效渲染格式或建模软件所需的三角网格
每个场景的生成过程通常耗时约十分钟——相比传统3D建模工作流程堪称闪电速度。
行业影响
此次发布使World Labs直接与Google DeepMind的Genie项目以及Decart等初创公司在新兴"世界模型"领域展开竞争。但专家们看到了超越创意应用的独特潜力。
"这可能改变机器人训练方式,"VR开发者Alicia Chen指出,"工程师可以即时生成无限变化的环境,无需费力构建测试场景。"
电影产业也将受益。制作团队可在投入实体布景或昂贵CGI前使用Marble进行快速场景原型设计。
有趣的是,该技术还可能影响视频生成本身。通过从详细的3D世界中导出序列(而非像OpenAI的Sora那样逐帧生成平面视频),Marble提供了对某些应用至关重要的卓越空间一致性。
未来展望?
免费测试版包含基础生成功能,付费方案(20美元/月起)则解锁商业权利和更高配额。早期使用者称赞其直观界面,但也指出精细控制方面存在局限。 正如一位测试者所言:"它不会立即取代Maya艺术家,但突然之间创建可探索世界变得像写邮件一样简单了." 团队暗示未来更新将实现人类与AI在这些虚拟空间内的协作——表明我们看到的只是这场技术革命的第一幕.
关键点:
- 公开测试版在成功有限测试阶段后推出
- 约10分钟即可从文本/图像/视频生成可导航3D世界
- 支持实时编辑和多种导出格式
- 潜在应用涵盖游戏、电影、机器人训练等领域
- 在新兴"世界模型"领域与Google DeepMind的Genie竞争



