谷歌Gemini Deep Research大升级:首次开放API让开发者自主构建AI研究应用

AI行业资讯1天前发布本文共计957个字,预计阅读时长4分钟。 墨白
9.5K 0 0

谷歌发布新一代AI研究助手:Gemini Deep Research智能体

谷歌于本周四正式推出基于最新Gemini3Pro模型的升级版”Gemini Deep Research”研究代理。这一全新版本不仅延续了自动生成研究报告的核心能力,更通过创新的交互API首次向开发者开放了谷歌SATA模型的研究功能,使第三方应用能够深度集成这一强大的AI研究工具。

谷歌Gemini Deep Research大升级:首次开放API让开发者自主构建AI研究应用

功能升级与应用场景

该智能体具备强大的信息整合能力,能够处理包含大量上下文数据的复杂提示。谷歌表示,该工具已在多个专业领域得到应用,包括企业并购尽职调查、药物安全性研究等高端场景,展现了其在商业与科研领域的实用价值。

谷歌同时宣布,未来将把这一深度研究代理整合至搜索、财经、Gemini应用及NotebookLM等核心产品中,这一战略部署预示着谷歌正加速推进”AI代理替代人工搜索”的未来愿景。

谷歌Gemini Deep Research大升级:首次开放API让开发者自主构建AI研究应用

技术创新:有效抑制AI幻觉

谷歌特别强调,Deep Research智能体基于其”最可靠”的Gemini3Pro模型构建。该模型经过专门优化,在执行复杂任务时能显著减少幻觉现象。对于需要长时间自主决策的深度研究任务而言,AI幻觉(即模型虚构信息)是亟待解决的关键问题,因为即使是一个微小的错误判断也可能导致整个研究结果失效。

性能测试表现

为验证技术突破,谷歌开发并开源了名为DeepSearchQA的全新基准测试,专门评估智能体在多步骤复杂信息检索任务中的表现。此外,谷歌还测试了评估通用知识的”Humanity’s Last Exam”基准,以及基于浏览器的智能体任务测试BrowserComp。

测试数据显示,谷歌新智能体在自研基准和Humanity测试中均领先于竞争对手。不过OpenAI的ChatGPT5Pro表现同样亮眼,在所有测试中紧随其后,并在BrowserComp测试中略占优势。

谷歌Gemini Deep Research大升级:首次开放API让开发者自主构建AI研究应用

行业竞争态势

然而这些对比结果很快就被刷新。就在同一天,OpenAI发布了代号为”Garlic”的GPT5.2模型。OpenAI宣称,其最新模型在一系列标准基准测试中全面超越竞争对手,包括谷歌在内,甚至在其自研的测试中也表现出色。

值得注意的是此次发布的时机选择。谷歌显然预见到全球科技界对GPT5.2发布的期待,特意选择同期公布这一AI进展,充分展现了科技巨头在人工智能领域日趋白热化的竞争态势。

© 版权声明

相关文章