跳转到主要内容

新型AI将照片转化为可直接模拟的3D物体

从平面照片到功能性3D模型

想象一下:给椅子拍张照,就能立即获得行为与实物完全一致的数字化版本——包括正确的重量分布、可活动部件和真实物理特性。这正是PhysX-Anything实现的功能。这项由南洋理工大学与上海人工智能实验室联合开发的突破性技术,填补了计算机视觉与物理模拟之间的鸿沟。

Image

工作原理

该系统采用巧妙的两步法:首先分析物体的整体物理属性(如质量分布和表面摩擦),然后聚焦细化各组件及其运动范围。这避免了视觉精确的模型在模拟中行为异常的常见问题。

PhysX-Anything的真正优势在于其高效编码方法——将所有必要信息(形状、关节、物理特性)打包成紧凑的数字包,使用时能快速重建。这使得该过程比当前最先进方法快约两倍。

实际表现

测试结果令人印象深刻:

  • 几何精度提升18%
  • 物理误差减少27%
  • 尺寸误差控制在2厘米内
  • 关节运动精度达5度以内

应用于机器人训练模拟时效果更显著:

  • 抓取成功率跃升12%
  • 所需训练时间减少近三分之一

研究团队使用从宜家家具到厨房用具的日常物品验证了这些改进。

开放共享的未来

研究人员已公开所有资源——代码、训练模型、数据集——希望加速该领域发展。他们正在开发2.0版本,将支持视频输入以捕捉物体随时间运动的状态。

对机器人专家和游戏开发者而言,这项技术能极大简化真实物体的数字孪生创建过程。无需再手动精细建模每个物理属性,未来可能只需拍照即可获得可运行的模拟模型。

其影响不仅限于机器人领域——建筑师测试家具布局、产品设计师用现有物品照片作为起点进行原型设计都将成为可能。

核心要点:

  • 将单张图像转化为可直接模拟的3D资源
  • 同时保留视觉外观与物理行为特性
  • 开源框架已在GitHub发布
  • 支持视频输入的版本将于明年初推出

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

智谱与华为联合发布完全基于国产技术的突破性AI图像模型
News

智谱与华为联合发布完全基于国产技术的突破性AI图像模型

中国AI企业智谱与华为合作推出GLM-Image,这是一款完全基于国产硬件训练的革命性多模态模型。这一创新系统结合了文本与图像生成能力,尤其在汉字渲染和复杂视觉任务方面表现优异。现已作为开源软件发布,有望使先进的AI图像创作更加普及。

January 14, 2026
AI创新国产技术计算机视觉
MIT自动化'运动工厂'赋予AI物理直觉
News

MIT自动化'运动工厂'赋予AI物理直觉

来自MIT、NVIDIA和加州大学伯克利分校的研究人员攻克了视频分析领域的一大难题——教会AI理解物理运动。他们的自动化'FoundationMotion'系统无需人工干预即可生成高质量训练数据,帮助AI系统以惊人准确度掌握轨迹与时机等概念。初期测试显示其性能超越更庞大模型,标志着机器真正理解物体运动规律的进展。

January 12, 2026
计算机视觉AI训练运动分析
中国研究人员教会AI在图像生成中自我纠错
News

中国研究人员教会AI在图像生成中自我纠错

中国高校取得突破性进展,解决了AI的'视觉读写障碍'——图像系统能理解概念却难以正确呈现的问题。他们的UniCorn框架如同内部质检团队,能在创作过程中捕捉并修正错误。早期测试显示其在空间准确性和细节处理方面有显著提升。

January 12, 2026
AI创新计算机视觉机器学习
腾讯新AI工具让3D角色栩栩如生
News

腾讯新AI工具让3D角色栩栩如生

腾讯混元推出突破性开源模型HY-Motion 1.0,可将文本转化为逼真的3D动画。这个百亿参数系统通过简单描述生成流畅自然的动作,解决了动画行业最大的痛点——高成本和长制作周期。游戏开发者和动画师现在可以在几分钟而非数天内创建复杂角色动作,并支持Unity和Unreal Engine等主流平台。

January 8, 2026
AI动画3D建模游戏开发
News

科技行业资深人士创立liko.ai,推出更智能的隐私保护家用摄像头

美团前硬件负责人李瑞安(Ryan Li)的新创企业liko.ai已获得商汤科技和科大讯飞关联公司的投资。这家初创公司旨在通过基于边缘的人工智能技术革新家用安防摄像头——该技术在本地而非云端处理视频,既解决了日益增长的隐私担忧,又增添了更智能的检测功能。他们的首批产品预计将于2026年年中面市。

January 7, 2026
智能家居计算机视觉边缘计算
波士顿动力Atlas机器人走出演示舞台,进入现代汽车工厂
News

波士顿动力Atlas机器人走出演示舞台,进入现代汽车工厂

波士顿动力标志性的Atlas机器人正脱离研究实验室的起源,走向现代汽车的生产线。这款人形机器现配备谷歌DeepMind的人工智能技术和360度视觉系统,有望在安全地与人类协作的同时改变制造车间。这标志着机器人技术从花哨的原型转向现实世界实用工具的关键时刻。

January 7, 2026
机器人技术工业自动化人工智能