騰訊把 33 語翻譯模型壓到 440MB,放手機上跑贏 Google 翻譯

騰訊混元團隊 2026-04-29 開源 Hy-MT1.5-1.8B-1.25bit,把原本 3.3GB 的 1.8B 翻譯模型透過 1.25-bit + 2-bit 混合量化壓縮到 440MB,可以在高通驍龍 865 等中階手機晶片上即時推理。

支援範圍:33 種語言 + 5 種方言 / 民漢語 + 1056 個翻譯方向。FLORES-200 評測超越 Google 翻譯等主流系統,翻譯品質「對齊 235B 級大模型」。國際機器翻譯比賽拿下 30 個第一名。

端上含義:純離線本地推理 — 翻譯內容不上傳雲端、不收集個資。對企業客戶(法律、金融、醫療文件翻譯)是可導入的關鍵 — 雲端 API 翻譯一直卡在合規問題,本地模型直接消除整個風險面。

騰訊內部已落地:元寶、騰訊會議、企業微信、QQ 瀏覽器都接了這個模型,用在後台取詞、郵件查閱、客服翻譯等場景。權重 + 程式碼放 Hugging Face 與魔搭社區,開發者可以直接拉下來嵌進自己的 app。

對中文圈開發者來說,這代表多語言 app 的翻譯層終於可以離開 Google Translate / DeepL 的雲端 API,變成自己掌控的端上元件。對隱私要求高的市場(歐洲企業、醫療),這也是中國大陸模型第一次提供有競爭力的離線方案。