Google的NotebookLM现已能理解你的涂鸦和快照
Google的NotebookLM获得视觉能力:图像理解功能上线

是否曾拍下写满公式的白板照片,后来却忘记它们的含义?Google的NotebookLM刚刚解决了这个问题。这款AI驱动的笔记工具现在能理解图像——从匆忙涂写的课堂笔记到教科书页面,甚至咖啡店的菜单。
工作原理
升级后的系统使用多模态AI对上传的图像进行光学字符识别(OCR)和语义分析。其独特之处在于:
- 手写识别能区分教授潦草的字迹和印刷文本
- 表格提取可保留复杂的数据结构
- 上下文链接能将视觉内容与你现有的笔记关联起来
"询问左下角的公式是如何推导的,"Google的演示建议道,"NotebookLM不仅能找到它,还会生成逐步解释。"
现实世界的魔力
其影响令人震惊:
- 学生可以拍摄教科书页面并立即查询特定图表或数值("图3.2展示了细胞有丝分裂的什么信息?")
- 研究人员可以捕捉会议白板内容,之后通过概念而非试图解读笔迹进行搜索
- 美食爱好者可以在国外拍下餐厅菜单并询问"冬阴功汤有多辣?"
该功能推出后需求激增——仅教育账户在前48小时就上传了50多万张图片,较之前的使用模式增长了340%。
隐私优先的方法
虽然最初处理是在云端进行的,但Google承诺"未来几周内"将为敏感材料提供本地处理选项。公司尚未公布定价计划——目前所有图像分析都使用现有的免费配额。
展望未来,计划于2026年推出的AR眼镜集成可能实现实时"所见即所问"功能,有望彻底改变各行业的实地工作方式。
关键点:
- 📸 NotebookLM现在通过先进的OCR和AI分析处理图像
- ✍️ 具备上下文意识,能理解印刷材料和手写笔记
- 🔍 支持关于视觉内容的自然语言查询("解释这个公式的推导过程")
- 🚀 教育领域采用率飙升,两天内上传量超过50万次
- 🕶️ AR眼镜集成将于明年推出,实现实时视觉查询
