小红书全新AI工具让你像专业人士一样构图
小红书与复旦在AI图像生成领域取得突破

社交媒体平台小红书与复旦大学的合作催生了InstanceAssemble这项突破性技术,终于让用户能够真正控制AI生成图像中物体的位置。这项被著名NeurIPS 2025会议收录的创新,解决了创作者长期抱怨的问题——AI容易错置元素或误解空间关系。
解决定位难题
虽然当前的文生图系统能产生惊艳的视觉效果,但在要求精确定位物体时常常出错。想要一只猫坐在特定的椅子上?AI可能会把它放在椅子旁边——或者更糟,变成某种猫椅混合体。InstanceAssemble通过其"实例组装注意力"机制改变了这一现状。
"这就像给AI赋予了空间意识,"复旦大学计算机科学系的李文博士解释道,"用户只需为每个元素定义边界框和描述,系统就能在正确的位置生成内容。"
轻量却强大
该技术的效率令人印象深刻。相比需要完整模型重新训练,InstanceAssemble仅需添加:
- Stable Diffusion3-Medium的3.46%参数
- Flux.1模型的区区0.84%
这种轻量级方法使得开发者能够轻松地在现有系统中采用该技术。
基准测试进展
团队并未止步于核心技术。他们还发布了Denselayout——一个包含90,000个实例的基准数据集——以及新的评估指标来标准化全行业的性能测量。
随着所有代码和预训练模型在GitHub上公开,InstanceAssemble可能彻底改变从平面设计到广告等多个领域,最终让创作者对AI生成的构图实现像素级精准控制。
关键点:
- 🎯 精确定位通过创新的"实例组装注意力"机制实现
- ⚡ 极小开销为现有模型增加不到4%的参数
- 🔓 完全开源包括预训练模型和基准测试工具



