跳转到主要内容

谷歌Gemini推出AI驱动的故事书生成器

谷歌Gemini推出AI故事书创作工具

谷歌在其Gemini AI聊天机器人中推出了创新的“故事书”功能,彻底改变了用户创作插图叙事的方式。这项新能力可将简短的故事提示转化为完整的10页书籍,包含AI生成的插图和文本。

故事书功能运作原理

该系统仅需基本情节描述即可生成专业排版的故事书。每页包含简练的文本与对应插图。Image展示了该工具的示例输出。

核心功能包括:

  • 多媒体集成:内置语音旁白营造沉浸式阅读体验
  • 风格定制:用户可选择黏土动画、动漫和漫画等视觉主题
  • 个性化选项:家长可上传儿童画作来激发定制化故事

全球可用性与语言支持

该功能现已在全球范围内的桌面和移动平台上线。值得注意的是,它对中文内容提供了强力支持,可生成格式规范、流畅的简体中文叙事。

技术规格:

  • 支持Gemini当前所有可用语言
  • 提供导出和打印功能以便制作实体书
  • 包含便捷的数字分享功能

当前局限与未来潜力

测试期间观察者发现角色形象偶尔存在跨页不一致现象。例如,“祖母”角色在不同插图中可能显示不同服装颜色。这些视觉连续性挑战指明了AI未来的改进方向。

尽管存在这些小问题,该工具仍展现出巨大潜力:

  • 教育应用:教师可创建定制化教材
  • 亲子活动:家庭可协作完成独特故事项目
  • 内容创作者:作家能快速原型化视觉叙事

故事书功能标志着谷歌在AI辅助创意工具领域的持续扩张,延续了其在生成艺术和写作助手方面的最新进展。

关键要点:

  1. 通过文本提示生成完整的10页插图故事书
  2. 支持包括全功能中文输出在内的多种语言
  3. 提供三种独特视觉风格并接受自定义图像输入
  4. 目前面临保持角色一致性的挑战
  5. 支持便捷导出以实现数字分享与实体印刷

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

爱奇艺AI演员库引发好莱坞分歧:创新还是威胁?

中国流媒体巨头爱奇艺推出颇具争议的'AI演员库',允许明星创建数字克隆。尽管该平台宣称能为制作节省成本,但业内人士担忧其可能完全取代真人表演。此举凸显了娱乐产业中技术进步与艺术完整性之间日益紧张的关系。

April 20, 2026
娱乐AI应用数字演员流媒体技术
News

AI初创公司Factory获1.5亿美元融资,推动新一代编程工具发展

在一项对AI辅助编程的重大信任投票中,初创公司Factory刚刚以15亿美元估值获得了1.5亿美元融资。在Khosla Ventures和红杉资本等顶级投资者的支持下,该公司通过智能切换AI模型,帮助摩根士丹利等企业客户编写更好的代码。Factory如何在这个竞争激烈的领域脱颖而出?一位伯克利博士学生又是如何将一封冷邮件变成独角兽公司的?

April 17, 2026
AI编程初创公司融资企业技术
Anthropic蓄势待发准备重磅AI发布:全新Claude模型与设计工具即将面世
News

Anthropic蓄势待发准备重磅AI发布:全新Claude模型与设计工具即将面世

Anthropic似乎准备再次搅动AI领域的格局,传闻指出本周将有双重发布:升级版Claude Opus 4.7模型和突破性的AI设计工具。这一预期中的发布已在市场上激起涟漪,设计软件类股票应声下跌。虽然新模型承诺带来渐进式改进,但真正的变革者可能是Anthropic进军AI驱动设计领域的举措——这一行动或将普及创意工具,同时撼动现有行业巨头的地位。

April 16, 2026
AI开发生成式AI科技行业
News

Hightouch凭借品牌智能AI营销工具实现1亿美元营收里程碑

营销科技初创公司Hightouch凭借其创新AI平台实现年经常性收入1亿美元,该平台帮助品牌无需设计团队即可创建符合品牌调性的内容。通过与企业现有创意工具连接,其系统能学习品牌标识以生成逼真广告。达美乐和Spotify等大客户现已使用该服务,该平台在不到两年内新增7000万美元收入。

April 16, 2026
AI营销品牌标识生成式AI
谷歌Gemini-TTS为合成语音带来类人表现力
News

谷歌Gemini-TTS为合成语音带来类人表现力

谷歌发布了迄今最先进的文本转语音模型Gemini-TTS,能够以接近70种语言生成极其自然的语音。其突破性在于:开发者可通过简单文本提示微调情感基调、语速和风格——彻底解决了'机器人声音'问题。从有声读物到客服机器人,这项突破性技术将使AI语音听起来比以往任何时候都更逼真。

April 16, 2026
语音技术AI合成谷歌Gemini
Gizmo智能学习应用用户突破1300万,获2200万美元融资进军高校市场
News

Gizmo智能学习应用用户突破1300万,获2200万美元融资进军高校市场

人工智能学习平台Gizmo在教育科技领域掀起波澜,全球用户已达1300万。获得2200万美元新融资后,该公司正全力将学习笔记转化为游戏化的趣味学习体验。这个最初为对抗学习枯燥而生的创意应用,如今旨在解决高等教育中的注意力时长挑战。投资者对Gizmo独特的人工智能与成瘾性学习机制融合模式寄予厚望。

April 16, 2026
教育科技AI学习初创企业融资