跳转到主要内容

TikTok与清华大学开源多模态视频框架HuMo

TikTok与清华大学发布开源HuMo框架

在AI视频生成领域的重大进展中,字节跳动智能创作团队与清华大学合作开源了HuMo框架,这是一个专为以人物为中心的视频生成(HCVG)设计的多模态系统。此次合作标志着学术研究与工业级AI应用结合的重要一步。

技术能力

HuMo框架的突出之处在于其能够同时处理三种输入模态

  • 文本描述
  • 参考图像
  • 音频提示

这种多模态方法使系统能够生成连贯的视频,其中人物根据复杂提示自然地移动。当前实现可生成480P和720P分辨率的视频,最大长度为97帧,速度为每秒25帧

Image

创新亮点

研究团队将HuMo的卓越性能归功于两大关键创新:

  1. 一个专注于人体运动模式的精心策划的训练数据集
  2. 一种新颖的渐进式训练方法,优于传统的单阶段方法

该框架采用先进的数据处理流程,在保持帧间时间一致性的同时,允许对角色动作进行精确控制。早期基准测试显示,与现有的单模态解决方案相比,HuMo实现了15-20%的运动保真度提升

实际应用

开发者可以利用HuMo进行多种用例开发,包括:

  • 虚拟内容创作
  • 教育视频制作
  • AI辅助的电影预可视化

开源版本包括预训练模型和全面的文档,降低了学术研究人员和商业开发者尝试该技术的门槛。

该项目已在GitHub上发布,并附有详细的技术论文发布于arXiv:https://arxiv.org/pdf/2509.08519

关键点:

  • 首个专门针对人物视频生成优化的开源多模态框架
  • 结合文本、图像和音频输入以产生连贯输出
  • 渐进式训练方法在运动质量上达到新基准
  • 实际应用涵盖娱乐、教育和专业媒体制作

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

神秘AI模型现身OpenRouter,具备万亿参数级威力
News

神秘AI模型现身OpenRouter,具备万亿参数级威力

OpenRouter悄然推出两款神秘AI模型——Hunter Alpha和Healer Alpha,引发广泛猜测。Hunter Alpha拥有惊人的万亿参数,擅长复杂推理;而Healer Alpha则在多模态理解方面表现突出。两者目前均以匿名方式运营并提供免费访问权限,其来源引发诸多有趣理论。

March 12, 2026
AI模型OpenRouter多模态AI
阿里巴巴全新紧凑型AI模型为边缘设备带来强大能力
News

阿里巴巴全新紧凑型AI模型为边缘设备带来强大能力

阿里巴巴通义千问团队发布了一系列轻量级AI模型,这些小巧的模型蕴含着令人印象深刻的能力。新模型参数规模从0.8B到9B不等,具备多模态处理能力,同时针对智能手机和物联网设备等边缘设备进行了优化。最小型号提供闪电般的响应速度,而较大型号在能力上可与更庞大的系统媲美——且资源消耗更低。这些现已登陆主流平台的模型,或将彻底改变我们在日常设备中部署AI的方式。

March 3, 2026
边缘AI阿里巴巴通义千问轻量级模型
美图新AI工具让店主瞬间制作专业级视频
News

美图新AI工具让店主瞬间制作专业级视频

美图设计工作室通过与Seedance 2.0合作,将电商视频创作提升至新高度。现在商家只需简单文本指令即可生成精美产品视频——无需摄像团队或剪辑技能。这一革命性组合解决了AI创意与商业精准度之间的微妙平衡问题,为卖家提供可直接使用且真正有效的高转化内容。

March 2, 2026
AI视频生成电商工具数字营销
News

万相剧场平台旨在驯服AI视频乱象

AI视频生成领域面临成长阵痛,炫目演示难以实现现实世界的稳定性。万相剧场全新全链条平台与生数科技合作直面这些挑战。通过整合多个专业模型并聚焦工作流优化,他们正致力于将AI视频从不可预测的新奇事物转变为可靠的生产工具。

February 28, 2026
AI视频生成动画技术创意工作流
News

快手AI视频模型在中国科技浪潮中登顶全球榜首

快手的Kling 3.0Pro在视频生成技术上超越全球竞争对手,基准测试获得1240分的惊人成绩。目前全球前15名中有7个中国模型,标志着电影AI能力的重大转变,或将重塑电影制作成本与工作流程。

February 27, 2026
AI视频生成快手中国科技
Keling AI 以创纪录分数称霸视频生成排行榜
News

Keling AI 以创纪录分数称霸视频生成排行榜

Keling最新AI视频模型以史无前例的1240分登顶全球基准测试,震撼科技界。这家中国企业的七款模型跻身全球前15名,标志着其在逼真视频生成领域的统治地位。专家表示,这一突破意味着AI技术正从实验阶段迈向专业影视制作工具。

February 26, 2026
AI视频生成Keling3.0Pro生成式AI