跳转到主要内容

Google的NotebookLM现已能理解你的涂鸦和快照

Google的NotebookLM获得视觉能力:图像理解功能上线

Image

是否曾拍下写满公式的白板照片,后来却忘记它们的含义?Google的NotebookLM刚刚解决了这个问题。这款AI驱动的笔记工具现在能理解图像——从匆忙涂写的课堂笔记到教科书页面,甚至咖啡店的菜单。

工作原理

升级后的系统使用多模态AI对上传的图像进行光学字符识别(OCR)和语义分析。其独特之处在于:

  • 手写识别能区分教授潦草的字迹和印刷文本
  • 表格提取可保留复杂的数据结构
  • 上下文链接能将视觉内容与你现有的笔记关联起来

"询问左下角的公式是如何推导的,"Google的演示建议道,"NotebookLM不仅能找到它,还会生成逐步解释。"

现实世界的魔力

其影响令人震惊:

  1. 学生可以拍摄教科书页面并立即查询特定图表或数值("图3.2展示了细胞有丝分裂的什么信息?")
  2. 研究人员可以捕捉会议白板内容,之后通过概念而非试图解读笔迹进行搜索
  3. 美食爱好者可以在国外拍下餐厅菜单并询问"冬阴功汤有多辣?"

该功能推出后需求激增——仅教育账户在前48小时就上传了50多万张图片,较之前的使用模式增长了340%。

隐私优先的方法

虽然最初处理是在云端进行的,但Google承诺"未来几周内"将为敏感材料提供本地处理选项。公司尚未公布定价计划——目前所有图像分析都使用现有的免费配额。

展望未来,计划于2026年推出的AR眼镜集成可能实现实时"所见即所问"功能,有望彻底改变各行业的实地工作方式。

关键点:

  • 📸 NotebookLM现在通过先进的OCR和AI分析处理图像
  • ✍️ 具备上下文意识,能理解印刷材料和手写笔记
  • 🔍 支持关于视觉内容的自然语言查询("解释这个公式的推导过程")
  • 🚀 教育领域采用率飙升,两天内上传量超过50万次
  • 🕶️ AR眼镜集成将于明年推出,实现实时视觉查询

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

小红书震撼AI界:开源其Relax训练引擎

出人意料的是,生活方式平台小红书开源了其名为Relax的AI训练引擎,该引擎专为多模态场景设计。这一复杂工具通过创新的并行处理技术,能够处理文本、图像、音频和视频。这家非传统AI玩家的意外之举,显示了该公司在人工智能开发上的雄心壮志,以及其希望在科技社区中建立影响力的愿望。

April 15, 2026
AI开源机器学习
News

火山引擎发布强大的视频生成API,助力创作者与企业释放创意潜能

火山引擎正式推出Seedance 2.0 API,为企业和个人用户提供前沿的视频生成能力。升级后的模型能处理文本、图像、音频和视频输入,并提升了物理精度和视觉真实感。除技术增强外,公司还为AI生成内容实施了严格的合规措施。行业专家认为,该产品或将彻底改变营销、娱乐和企业视频制作的工作流程。

April 14, 2026
AI视频生成创意科技数字内容创作
News

中国将人工智能融入教师资格考试与国家课程体系

中国教育体系正大跨步迈入AI时代。五大政府部门联合推出一项宏伟计划,将人工智能全面嵌入国家教育生态系统。从教师资格认证要求开始,到各级教育阶段的必修课程,该倡议旨在到2030年建成全面具备AI素养的社会。该计划将重塑从课堂教学到教育基础设施的各个方面,同时建立严格的数字伦理保障机制。

April 14, 2026
AI教育中国教育改革数字素养
谷歌Gemini通过交互式3D模型让科学活起来
News

谷歌Gemini通过交互式3D模型让科学活起来

谷歌Gemini AI现支持用户以3D形式探索科学。学习者不再局限于阅读复杂概念,而是可以操纵分子结构、模拟物理实验,并实时观察行星轨道运行。这些交互功能响应语音指令并允许参数调整,使抽象概念变得触手可及。虽然目前教育账户暂不可用,但该工具有望彻底改变我们理解从量子物理到分形几何等一切事物的方式。

April 10, 2026
AI教育交互式学习STEM技术
News

中国推出全民AI教育计划,面向各年龄段提供免费课程

五大部委联合推出雄心勃勃的人工智能教育计划,将人工智能课程覆盖从小学到职业培训的各级学生。该计划包括开发免费慕课资源,并将AI融入核心课程体系,特别关注通过数字平台缩小城乡教育差距。这标志着中国为AI时代培养人才所采取的最全面举措。

April 10, 2026
AI教育数字素养中国科技政策
MiniMax推出开源MMX-CLI工具,强力赋能AI智能体工作流
News

MiniMax推出开源MMX-CLI工具,强力赋能AI智能体工作流

MiniMax发布开源命令行工具MMX-CLI,助力AI智能体无缝调用先进多模态能力。这一创新解决方案省去了复杂的接口适配工作,使智能体可直接访问编程、视频生成及音频合成模型。凭借输出隔离和语义状态码等特性,MMX-CLI正在重塑数字助手处理复杂创意工作流的方式。

April 10, 2026
AI开发命令行工具MiniMax