Google 釋出 Gemini 3 Deep Think：為科學與工程而生的「深度思考」模式

Google 今天宣佈了 Gemini 3 Deep Think 的重大升級。這不僅僅是聊天機器人的更新，而是專門針對科學研究、高階工程與複雜推理所打造的特化模式。

如果說一般的 LLM 是能言善道的通才，那麼 Deep Think 就是那個在實驗室裡穿著白袍、對數據錙銖必較的首席科學家。

Google 這次的升級重點在於解決那些「沒有標準答案」或「數據雜亂不全」的難題。

文章中舉了幾個令人印象深刻的實際案例：

數學審查：Rutgers 大學的數學家 Lisa Carbone 用它來審查一篇關於高能物理與量子力學的高難度論文。Deep Think 竟然找出了一個連人類同行審查都沒發現的微小邏輯漏洞。
材料發現：Duke 大學的 Wang Lab 用它來優化晶體生長製程。Deep Think 設計出了一套全新配方，成功生長出超過 100 μm 的薄膜，達成了過去傳統方法難以企及的目標。

Deep Think 在多項高難度測試中刷新了紀錄：

ARC-AGI-2：達到了前所未有的 84.6% (這是一個測試 AI 通用推理能力的指標，通常很難刷分)。
Codeforces：程式競賽積分達到 3455 Elo (這已經是傳說級紅人/黑紅的等級了)。
奧林匹亞競賽：在 2025 年的國際數學、物理、化學奧林匹亞競賽中，都達到了金牌水準。
Humanity’s Last Exam：在這個旨在測試模型極限的新基準測試中，拿下了 48.4% 的分數 (聽起來不高，但在這個測試裡已經是新標準了)。

對於工程師來說，Deep Think 展示了一個很科幻的應用：從手繪草圖直接生成 3D 列印檔案。它能理解你的草圖結構，進行物理建模，並輸出可供列印的檔案。

目前有兩個管道可以體驗到這個強化的 Deep Think 模式：

Google AI Ultra 訂閱戶：現在就可以在 Gemini App 中直接切換使用。
API Early Access：這是重點！Google 首次將 Deep Think 透過 API 開放給開發者、研究人員與企業。如果你想用它來打造更強大的 Agent 或分析工具，現在可以申請 Early Access。

Gemini 3 Deep Think 的出現，標誌著 AI 正在從「生成內容」走向「解決問題」。當 AI 能夠幫數學家找錯、幫材料學家設計實驗時，它就不再只是生產力的工具，而是推動科學邊界的夥伴。

對於開發者來說，API 的開放意味著我們可以將這種「深度思考」的能力整合進自己的工作流中——也許下一代的自動化 Debugger 或架構師 Agent，就會由 Deep Think 來驅動。

metamuse