什麼模型最適合 OpenClaw ?
這大概是最近最多人問的問題。底下的排名源自 PinchBench 的測試測試(評估OpenClaw代理任務),看起來是有參考價值的。

評分標準採成功率、回應速度、花費。
任務成功率前五名分別是
google/gemini-3-flash-preview
minimax/minimax-m2.1
moonshotai/kimi-k2.5
anthropic/claude-sonnet-4.5
google/gemini-3-pro-preview
是不是蠻意外的?竟然不是 Opus,不過也有可能都是複雜任務交給 Opus 跑,所以失敗率高、成功率低,簡單任務找便宜模型跑、像是 gemini-3-flash,加上又容易成功,所以成功率高?不過我常用的模型也是 gemini-3-flash-prevew 與 gemini-3-pro-preview 為主,一組 API KEY 切換就好。都很能做事的模型。
其他評分自己看了,單看速度沒什麼意義,回得快、不成功沒什麼用,COST 值得參考, gpt-5-nano 最便宜,成功率也有排名第九,可以用。