Google 推出 TranslateGemma:基於 Gemma 3 的高效能開放翻譯模型
Google 今日宣佈推出 TranslateGemma,這是一套基於 Gemma 3 架構構建的全新開放式翻譯模型套件。這項新發布標誌著開放式翻譯技術的重要里程碑,旨在提供高效能、涵蓋廣泛語言的翻譯解決方案,支持全球 55 種語言的無縫交流。
核心亮點:效率與性能的突破
TranslateGemma 系列模型提供了三種參數規模,以滿足從移動設備到雲端運算的各種部署需求:
- 4B 模型:專為行動裝置和邊緣計算優化。
- 12B 模型:適合消費級筆記型電腦,提供研究級別的性能。
- 27B 模型:追求最高保真度,適用於高效能運算環境(如 H100 GPU/TPU)。
值得注意的是,Google 的評估顯示 12B 的 TranslateGemma 模型在 WMT24++ 基準測試中的表現,優於其基礎的 Gemma 3 27B 模型。這意味著開發者可以使用不到一半的參數,獲得更高品質的翻譯結果,同時實現更低的延遲和更高的吞吐量。
技術創新:雙階段微調
TranslateGemma 的卓越性能歸功於其「蒸餾」過程,將大型 Gemini 模型的知識注入到更輕量的架構中。訓練過程包含兩個關鍵階段:
- 監督式微調 (SFT):使用大量人工翻譯和 Gemini 生成的高品質合成數據進行訓練。
- 強化學習 (RL):利用 MetricX-QE 和 AutoMQM 等先進指標作為獎勵模型,引導模型生成更自然、流暢的譯文。
語言覆蓋與多模態能力
該系列模型支援 55 種核心語言,涵蓋了從高資源語言(如中文、西班牙語)到多種低資源語言。此外,儘管未針對多模態進行特定微調,TranslateGemma 繼承了 Gemma 3 的視覺能力,在翻譯圖像文本方面也展現了優異的性能。
TranslateGemma 現已對外開放,研究人員和開發者可以透過以下渠道獲取:
- 下載模型:Kaggle、Hugging Face
- 技術報告:arXiv
- 部署體驗:Vertex AI
這一系列模型的發布將進一步降低高品質翻譯技術的門檻,促進跨語言溝通與應用的發展。
Source : https://blog.google/innovation-and-ai/technology/developers-tools/translategemma/