跳转到主要内容

Google的NotebookLM现已能理解你的涂鸦和快照

Google的NotebookLM获得视觉能力:图像理解功能上线

Image

是否曾拍下写满公式的白板照片,后来却忘记它们的含义?Google的NotebookLM刚刚解决了这个问题。这款AI驱动的笔记工具现在能理解图像——从匆忙涂写的课堂笔记到教科书页面,甚至咖啡店的菜单。

工作原理

升级后的系统使用多模态AI对上传的图像进行光学字符识别(OCR)和语义分析。其独特之处在于:

  • 手写识别能区分教授潦草的字迹和印刷文本
  • 表格提取可保留复杂的数据结构
  • 上下文链接能将视觉内容与你现有的笔记关联起来

"询问左下角的公式是如何推导的,"Google的演示建议道,"NotebookLM不仅能找到它,还会生成逐步解释。"

现实世界的魔力

其影响令人震惊:

  1. 学生可以拍摄教科书页面并立即查询特定图表或数值("图3.2展示了细胞有丝分裂的什么信息?")
  2. 研究人员可以捕捉会议白板内容,之后通过概念而非试图解读笔迹进行搜索
  3. 美食爱好者可以在国外拍下餐厅菜单并询问"冬阴功汤有多辣?"

该功能推出后需求激增——仅教育账户在前48小时就上传了50多万张图片,较之前的使用模式增长了340%。

隐私优先的方法

虽然最初处理是在云端进行的,但Google承诺"未来几周内"将为敏感材料提供本地处理选项。公司尚未公布定价计划——目前所有图像分析都使用现有的免费配额。

展望未来,计划于2026年推出的AR眼镜集成可能实现实时"所见即所问"功能,有望彻底改变各行业的实地工作方式。

关键点:

  • 📸 NotebookLM现在通过先进的OCR和AI分析处理图像
  • ✍️ 具备上下文意识,能理解印刷材料和手写笔记
  • 🔍 支持关于视觉内容的自然语言查询("解释这个公式的推导过程")
  • 🚀 教育领域采用率飙升,两天内上传量超过50万次
  • 🕶️ AR眼镜集成将于明年推出,实现实时视觉查询

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

前谷歌高管的AI平台旨在培养年轻科学家,而非仅仅打造答题机器

一个名为Fermi.ai的新型AI教育平台正在采用不同的学生学习方法。由前谷歌高管Piyush Ranjan创立,它专注于在STEM学科中培养深度思考能力,而非简单地提供答案。早期结果显示,随着学生使用该系统的智能画布和自适应辅导功能,他们正变得更加独立自主。总部位于新加坡并已在美国和印度初步推出,这种创新方法可能会改变我们对AI在教育中的看法。

February 9, 2026
AI教育STEM学习教育技术
Kling AI 3.0震撼发布:触手可及的电影级魔法
News

Kling AI 3.0震撼发布:触手可及的电影级魔法

Kling AI最新3.0版本通过智能分镜和长达15秒的片段扩展彻底改变视频创作。本次更新引入电影级光照技术,呈现惊艳的4K画质,并简化多图像风格融合功能。目前黑金会员可优先体验,这些工具将助力大众轻松实现专业级叙事效果。

February 5, 2026
AI视频生成创意工具数字叙事
News

腾讯AI布局再添强援:顶尖科学家田雨鹏加入混元团队

腾讯在人工智能人才争夺战中再下一城,聘请田雨鹏担任混元多模态团队首席研究科学家。这位清华大学博士、前Sea AI Lab研究员将专注于提升腾讯旗舰AI模型的强化学习能力。此举彰显了腾讯持续领跑多模态AI前沿研发的决心。

February 3, 2026
腾讯人工智能研究强化学习
News

英国推出免费AI培训计划以赋能劳动力

英国正通过一项面向所有成年人提供免费在线课程的大胆新举措,大力押注人工智能教育。该政府计划侧重于实用技能,如使用AI工具进行写作、内容创作和行政任务。通过20分钟的碎片化课程和十年内培训1000万工人的宏伟目标,这一举措有望每年为英国经济带来140亿英镑的增长,同时为公民迎接AI驱动的未来做好准备。

January 28, 2026
AI教育英国劳动力发展数字技能培训
News

达沃斯警告:教育AI需要的远不止大模型

在达沃斯论坛上,松鼠AI的梁静对教育AI泡沫发出了警示。她指出,当前依赖通用大语言模型的解决方案无法真正理解教学。真正的教育AI需要深度专业化和对学习过程的深刻理解——而不仅仅是完美的答案。

January 23, 2026
AI教育教育科技大语言模型
News

百度文心ERNIE 5.0以大规模AI升级开创先河

百度发布了其迄今最先进的AI模型ERNIE 5.0,拥有惊人的2.4万亿参数。这款多模态强大模型可同时处理文本、图像、音频和视频,在40多项基准测试中超越竞争对手。通过汇集数百位跨领域专家的智慧,ERNIE 5.0将为个人用户和企业提供更智能的响应和更快的处理能力。

January 22, 2026
人工智能百度多模态AI