跳转到主要内容

TuSimple Unveils 'Ruyi' Image-to-Video Model and Ruyi-Mini-7B

TuSimple Unveils 'Ruyi' Image-to-Video Model and Ruyi-Mini-7B

北京,中国 — 在 2024 年 12 月 17 日,TuSimple Future Technology Co., Ltd. 正式宣布发布其首个大型模型,Ruyi,作为其 TuSheng Video 系列的一部分。该公司还开源了 Ruyi-Mini-7B 版本,可从 Hugging Face 平台下载。TuSimple 成立于 2015 年,总部位于加利福尼亚州圣地亚哥,专注于在多个行业中应用 AI 技术,包括 动画、游戏和 运输。

Features of the Ruyi Model

Ruyi 模型专门设计用于在消费者级显卡上运行,提供详细的部署说明和工作流程,通过 ComfyUI 实现快速设置和使用。其性能在 帧一致性、运动流畅性、色彩表现和 构图方面表现出色,使其成为视觉叙事的有前景的工具。Ruyi模特旨在迎合 动漫 和 游戏 爱好者,经过在这些领域的广泛训练。

image

Ruyi 支持多分辨率和多时长的视频生成,能够生成 384×384 到 1024×1024 像素的输出,具有任意宽高比。用户可以创建长达 120 帧 或 5 秒 的视频,并可以控制第一帧的生成和关键帧之间的转换。该模型还提供运动幅度控制和五种镜头控制类型。Ruyi 基于 DiT 架构构建,包含一个 Casual VAE 模块 和一个 Diffusion Transformer,总计约 71 亿参数,并在约 2 亿个视频片段上进行了训练。

Challenges and Future Improvements

尽管取得了进展,Ruyi 仍面临挑战,包括 手部扭曲、多人场景中的面部细节崩溃和 不可控的过渡 问题。TuSimple 正在积极解决这些挑战,以便在未来的更新中改善模型。

展望未来,TuSimple 计划继续关注场景需求,并在 直接 CUT 生成方面取得突破。公司计划在下一个版本中提供两种模型版本,以满足创作者的多样化需求。通过使用像 Ruyi 这样的巨大模型,TuSimple 希望减少与创建动漫和游戏内容相关的 开发周期 和 成本。Ruyi 模型已经可以通过输入关键帧或在它们之间创建过渡生成五秒的素材,显著加快开发过程。

Accessing Ruyi-Mini-7B

对 Ruyi-Mini-7B 模型感兴趣的开发者和创作者可以通过以下链接访问它:

Hugging Face Link

Key Points

  1. TuSimple 发布了首个大型模型 'Ruyi',用于图像到视频的转换。
  2. Ruyi 模型与消费者级硬件兼容,促进了可获取性。
  3. 未来的更新将解决现有挑战并引入新功能以提升性能。

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

LCK明星选手Roamer以93%惊人胜率平息AI质疑

当名为'택배기사#한 진'的账号以令人瞠目的93%胜率横扫韩国《英雄联盟》排位赛时,玩家们纷纷质疑——这肯定是AI在操作。真相却更令人意外:BRO中单选手Roamer只是进入了神级状态。他谦逊的回应?'大概99%靠运气'。这一事件凸显了职业选手与普通玩家之间惊人的技术差距。

January 21, 2026
League of LegendsEsportsArtificial Intelligence
NVIDIA的NitroGen AI通过观看4万小时YouTube视频学习游戏技能
News

NVIDIA的NitroGen AI通过观看4万小时YouTube视频学习游戏技能

NVIDIA发布了突破性AI NitroGen,该AI通过分析数千小时的玩家视频掌握了游戏技能。与专业游戏机器人不同,这个通用智能体能够以惊人的技巧适应各种游戏类型。秘诀何在?通过研究YouTube和Twitch直播中真实玩家的手柄输入。研究人员表示,在面对陌生游戏时,其表现比传统AI高出52%。NVIDIA已开源该项目,以加速开发多功能虚拟智能体。

December 22, 2025
AIGamingMachine Learning
联合国推出AI难民角色以提高公众意识
News

联合国推出AI难民角色以提高公众意识

联合国下属研究机构推出两个AI虚拟角色阿米娜和阿卜杜拉,用于向公众普及全球难民危机。这个由联合国大学政策研究中心主导的实验性项目允许用户与这些虚构难民互动,但出现了技术问题。批评者认为难民可以自己发声。

July 14, 2025
United NationsAI technologyrefugee crisis
英伟达发布G-Assist:专为玩家打造的AI助手
News

英伟达发布G-Assist:专为玩家打造的AI助手

英伟达推出Project G-Assist,这是一款本地运行的AI助手,专为GeForce RTX显卡设计,提供游戏优化、系统诊断和GPU超频功能。该工具无需依赖云端,并支持开发者插件。

March 28, 2025
NvidiaAIGaming
Doubao Unveils Advanced Visual Understanding Model
News

Doubao Unveils Advanced Visual Understanding Model

在火山引擎FORCE动力大会上,Doubao介绍了其大型模型家族的重大升级,推出了一种新的视觉理解模型,允许同时进行文本和图像查询。这一创新将增强各个行业的应用,包括教育和电子商务,同时为开发者提供具有成本效益的使用。

December 19, 2024
DoubaoVisual UnderstandingAI technology
Google Photos Unveils 2024 Recap Feature with AI Insights
News

Google Photos Unveils 2024 Recap Feature with AI Insights

Google Photos推出了2024年度照片回顾功能,利用人工智能生成用户一年中重要时刻的个性化亮点。这个创新工具不仅展示照片,还提供有关用户拍照习惯的统计数据和见解,增强了回忆过去一年的整体体验。

December 10, 2024
Google PhotosAI technologyAnnual Recap