谷歌向开发者开放其AI研究利器
谷歌研究型AI正式对外开放
在一项可能重塑开发者构建智能应用方式的举措中,谷歌已全面开放其Deep Research Agent的访问权限。这个曾专属于谷歌生态的强大工具,现在允许任何开发者在自己的项目中运用复杂的AI研究能力。
比普通搜索更智能
升级后的代理不仅能获取信息——它还能像研究员一样思考。想象一个能提出问题、筛选结果、发现知识缺口并持续挖掘直至找到可靠答案的助手。它基于Gemini 3 Pro框架构建,但专门针对深度研究任务进行了优化,提高了准确性并减少了错误。
"虽然没有任何系统是完美的,"谷歌在公告中提醒道,"但这代表了我们迄今为止最可靠的自主研究工具。"公司建议将其用于探索性工作而非最终事实核查。
提升AI评估标准
认识到当前基准测试对复杂研究任务的不足后,谷歌推出了DeepSearchQA——一个新的开源测试平台。这不是你常见的多选题测验:
- 包含900个精心设计的因果链问题
- 涵盖17个学术和技术领域
- 同时衡量答案质量和检索全面性
- 帮助诊断思考时间如何影响结果
该基准反映了现实世界研究中每一步都建立在先前发现基础上的特点——这是标准测试经常忽略的关键能力。
开发者现在(及未来)能获得什么
当前版本提供了强大的实用功能:
- 文档智能处理:解析PDF、CSV等格式文件
- 结构化输出:控制研究发现呈现方式
- 透明溯源:每个结论都附带可验证的引用来源
- 开发者友好格式:可直接集成的JSON输出
即将推出的功能包括原生图表生成和扩展的数据源支持。预计这些特性将很快在Google搜索、NotebookLM和金融产品中推出。
真正的颠覆者可能是新的交互式API——一个连接Deep Research Agent和Gemini模型的标准化方式。目前处于公开测试阶段的这个接口有望简化复杂代理应用的构建过程。
关键要点:
- 🔍 研究民主化:开发者现在可以将谷歌级的研究能力植入自己的应用
- 🎯 更好的基准测试:DeepSearchQA测试AI如何处理真实的多步骤调查
- ⚙️ 新工具可用:从文档分析到JSON格式的结构化报告
- 🤖 API优势:标准化接口让使用先进模型变得更简单



