Google 釋出 Gemini 3 Deep Think:為科學與工程而生的「深度思考」模式

 

Google 今天宣佈了 Gemini 3 Deep Think 的重大升級。這不僅僅是聊天機器人的更新,而是專門針對科學研究、高階工程與複雜推理所打造的特化模式。

如果說一般的 LLM 是能言善道的通才,那麼 Deep Think 就是那個在實驗室裡穿著白袍、對數據錙銖必較的首席科學家。

它強在哪裡?

Google 這次的升級重點在於解決那些「沒有標準答案」或「數據雜亂不全」的難題。

1. 真正的科學助手 (Real-world Science)

文章中舉了幾個令人印象深刻的實際案例:

  • 數學審查:Rutgers 大學的數學家 Lisa Carbone 用它來審查一篇關於高能物理與量子力學的高難度論文。Deep Think 竟然找出了一個連人類同行審查都沒發現的微小邏輯漏洞
  • 材料發現:Duke 大學的 Wang Lab 用它來優化晶體生長製程。Deep Think 設計出了一套全新配方,成功生長出超過 100 μm 的薄膜,達成了過去傳統方法難以企及的目標。

2. 殺手級的推理能力 (Benchmarks)

Deep Think 在多項高難度測試中刷新了紀錄:

  • ARC-AGI-2:達到了前所未有的 84.6% (這是一個測試 AI 通用推理能力的指標,通常很難刷分)。
  • Codeforces:程式競賽積分達到 3455 Elo (這已經是傳說級紅人/黑紅的等級了)。
  • 奧林匹亞競賽:在 2025 年的國際數學、物理、化學奧林匹亞競賽中,都達到了金牌水準。
  • Humanity’s Last Exam:在這個旨在測試模型極限的新基準測試中,拿下了 48.4% 的分數 (聽起來不高,但在這個測試裡已經是新標準了)。

3. 從草圖到實物 (Engineering)

對於工程師來說,Deep Think 展示了一個很科幻的應用:從手繪草圖直接生成 3D 列印檔案。它能理解你的草圖結構,進行物理建模,並輸出可供列印的檔案。

如何使用?

目前有兩個管道可以體驗到這個強化的 Deep Think 模式:

  1. Google AI Ultra 訂閱戶:現在就可以在 Gemini App 中直接切換使用。
  2. API Early Access:這是重點!Google 首次將 Deep Think 透過 API 開放給開發者、研究人員與企業。如果你想用它來打造更強大的 Agent 或分析工具,現在可以申請 Early Access

結語

Gemini 3 Deep Think 的出現,標誌著 AI 正在從「生成內容」走向「解決問題」。當 AI 能夠幫數學家找錯、幫材料學家設計實驗時,它就不再只是生產力的工具,而是推動科學邊界的夥伴。

對於開發者來說,API 的開放意味著我們可以將這種「深度思考」的能力整合進自己的工作流中——也許下一代的自動化 Debugger 或架構師 Agent,就會由 Deep Think 來驅動。

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-deep-think