Google's Yangmou: Launching the "Deepest" Research Agent in History on the Release Day of GPT-5.2

華爾街見聞
2025.12.12 06:25
portai
I'm PortAI, I can summarize articles.

谷歌推出迄今最強的深度研究型 Agent——GeminiDeep Research 的 “重製版”,試圖定義 Agent 的基礎設施級入口。未來可能不是用户 “谷歌一下”,而是你的 Agent 替你谷歌一切。

在全球 AI 敍事走向 “Agent 時代” 的關鍵節點,谷歌選擇了一個頗具戲劇性的發佈時機。

週四,就在 OpenAI 端出備受期待的 GPT-5.2(內部代號 Garlic)之日,谷歌同步推出了迄今最強的深度研究型 Agent——Gemini Deep Research的 “重製版”,並宣稱其基於旗下最先進的 Gemini 3 Pro 模型。同日,DeepMind 還宣佈將在英國建立首個自動化研究實驗室,利用 AI 與機器人加速材料科學實驗。

這不是 “撞車”,更像一場精心策劃的陽謀:在競爭對手聚焦全球目光時,谷歌以一款更具戰略意味的產品回應——將 Agent 推向操作系統級能力。

從 “寫報告” 到 “嵌入應用”:谷歌試圖定義 Agent 的基礎設施級入口

全新 Gemini Deep Research 已不是傳統意義上的 “自動寫研究報告” 的工具,它被定位為:

  • 可處理更大規模的上下文、能消化 “信息山脈” 的深度研究 Agent

  • 可被開發者直接嵌入 App 的 “AI 研究內核”

  • 能持續執行數分鐘甚至數小時、多步驟推理任務的長鏈式推理 Agent

這些能力普遍指向一個趨勢:谷歌正試圖把 Deep Research 變成未來 AI 時代的 “搜索引擎底層能力”。

為了讓開發者把 Deep Research 更輕鬆地嵌入自己的應用,谷歌推出了全新的 Interactions API。這等於是把 “搜索 + 多步驟推理 + 評估” 打包成操作系統級服務。

谷歌同時宣佈,Deep Research 將陸續進入谷歌搜索、谷歌財經、Gemini 應用,以及 NotebookLM。

換句話説:未來不是用户 “谷歌一下”,而是你的 Agent 替你谷歌一切

為什麼是 Deep Research?谷歌想解決 AI 走向 Agent 後的最大痛點:幻覺率。

谷歌稱 Deep Research 受益於 Gemini 3 Pro 的 “更高事實性”,能降低在長鏈推理任務中累積幻覺所導致的結果失真。這類任務可能持續數十分鐘甚至數小時,風險顯著。

谷歌造新基準:DeepSearchQA、BrowserComp、Humanity’s Last Exam

為驗證性能,谷歌發佈新的 DeepSearchQA 基準,用於測試多步驟信息檢索,並開源該基準。

在谷歌自有基準和"人類最後考試"基準測試中,新 Agent 擊敗了競爭對手,但 OpenAI 的 ChatGPT 5 Pro 表現接近,並在 BrowserComp 測試中略勝谷歌。

然而,這些基準比較在谷歌發佈的那一刻就幾乎過時了。因為同一天,OpenAI 發佈了備受期待的 GPT-5.2,號稱智能體編碼最強,趕超人類專家。OpenAI 聲稱該模型在一系列典型基準測試中擊敗了競爭對手,特別是谷歌。

從結果看,這一天成為谷歌與 OpenAI 同台競爭的 “正面交鋒”。

谷歌選擇在 GPT-5.2 發佈日同步公佈 Deep Research,很難不被視為一種主動競爭姿態——既是回應 OpenAI 的新模型,也是試圖在 Agent 化快速發展之際,提前佔據開發者入口。

在 AI Agent 即將成為新一代 “搜索框” 的情況下,谷歌與 OpenAI 的爭奪已經從模型戰爭轉向誰能成為未來信息訪問方式的基礎設施