跳转到主要内容

百度文心5.0升级AI能力

百度文心5.0升级AI能力

百度AI助手文心推出5.0版本,标志着自2023年7月首次发布以来在功能与品牌重塑上的重大飞跃。最新版本将该工具转变为多模态AI平台,集创作、搜索、交互与多媒体生成于一体。

魔法漫画:让视觉叙事大众化

文心5.0的亮点功能是魔法漫画,它简化了漫画创作流程。用户上传照片并提供简短描述,AI即可生成包含分镜、对话和风格化画面的连贯多页漫画。此功能无需专业绘画技能,让视觉叙事触手可及。

Image

创意照片编辑:轻松获得专业效果

新版本搭载智能照片编辑引擎,可一键应用艺术滤镜、风格迁移和场景重构。用户无需技术背景即可调整色彩、构图和细节——从日常自拍到商业海报皆适用。

可靠写作:为专业人士提供事实核查

针对文本任务,文心推出可靠写作功能,专为报告或学术论文等高准确性场景设计。AI在内容生成同时验证事实与引用——这对注重可信度的专业人士至关重要。

多模态交互:无缝沟通渠道

平台现支持语音查询图片上传文档解析作为输入方式。其上下文理解能力可实现搜索查询、写作辅助与会话交互间的流畅切换。

视频生成与多语言支持:打破沟通壁垒

本次升级扩展了视频功能——用户可利用可定制模板将静态图像转为动态视频。此外,实时多语言视频通话通过支持多种语言/方言促进跨地区交流。

核心亮点:

  • 魔法漫画可通过照片/文字提示轻松创作漫画
  • 照片编辑工具提供无需复杂操作的专业级效果
  • 可靠写作在内容生成过程中验证事实准确性
  • 支持多模态输入(语音/图片/文档)实现自然交互
  • 视频功能包含图像转视频及多语言沟通

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

阿里千问App明日上线:您的AI生活管家

阿里巴巴全新阿里千问App将于明日发布,从简单的问答工具升级为全方位的AI生活助手。整合高德地图、饿了么外卖、淘宝购物及阿里健康服务,它将简化日常决策——从寻找完美的家庭出游地点到预订临时晚餐。该应用依托阿里云通义大模型,分析实时交通、天气及偏好数据,提供个性化行动方案并支持一键执行。

January 15, 2026
AI助手阿里巴巴生态智慧生活
阿里巴巴的通义千问现支持语音点餐和旅行预订
News

阿里巴巴的通义千问现支持语音点餐和旅行预订

阿里巴巴的通义千问应用实现重大突破,已与淘宝、支付宝等生态服务无缝集成。用户现在只需语音指令即可完成外卖点单、网购或机票预订。在直播演示中,这款AI助手仅用一句话就成功处理了40杯饮品的订单。本次更新引入了400多项正在测试中的新AI功能。

January 15, 2026
AI助手阿里巴巴语音技术
News

AI现已接管你的晚餐预订——你甚至察觉不到它不是人类

Qwen应用与阿里巴巴口碑合作,彻底革新餐厅预订方式。只需向手机说出你的需求——地点、预算、特殊要求——其逼真到令人惊诧的AI就会替你致电餐厅。早期用户反馈称,该语音助手完美模拟自然对话,餐厅根本意识不到正在与软件交谈。每次通话均会生成文字记录并录音备查,标志着Qwen已转型为全能数字管家,从机票到外卖配送无所不包。

January 15, 2026
AI助手语音技术智能餐饮
阿里巴巴的通义千问用户破亿速度超预期
News

阿里巴巴的通义千问用户破亿速度超预期

阿里巴巴的AI助手通义千问据称在发布仅两个月后月活跃用户就突破1亿,显示出学生和专业人士的强劲采用率。虽然阿里巴巴尚未确认具体数字,但这一快速增长表明中国市场对AI工具的需求正在升温。该应用代表了阿里巴巴进军消费级AI市场的战略举措。

January 14, 2026
阿里巴巴AI助手消费科技
Salesforce借助Anthropic的AI大脑为Slack注入强劲动力
News

Salesforce借助Anthropic的AI大脑为Slack注入强劲动力

Salesforce推出了一款基于Anthropic的Claude模型的新型AI助手,专为Slack打造。这一智能集成犹如职场得力助手——它能整合来自Salesforce、Google Drive等平台的对话、文件和数据,从而优化会议、内容创作及复杂查询流程。目前该机器人正面向高级客户逐步推出,并配有严格的安全协议,预示着未来AI代理将协调整个工作流程的愿景。

January 14, 2026
SalesforceSlackAI助手
谷歌Nano Banana Pro风靡全球:短短2个月生成10亿张图片
News

谷歌Nano Banana Pro风靡全球:短短2个月生成10亿张图片

谷歌最新图像生成工具Nano Banana Pro(官方名Gemini3Pro Image)席卷创意界。自11月发布以来,全球用户利用其影棚级编辑功能已生成惊人的10亿张图片。该模型提供专业级的灯光、焦点和构图控制,同时支持高分辨率多语言文本生成。谷歌还推出了分级访问机制,免费用户每日生成次数有限,而订阅用户则可享受更高的配额。

January 13, 2026
AI成像Google Gemini创意工具