腾讯把 33 语翻译模型压到 440MB,放手机上跑赢 Google 翻译

腾讯混元团队 2026-04-29 开源 Hy-MT1.5-1.8B-1.25bit,把原本 3.3GB 的 1.8B 翻译模型通过 1.25-bit + 2-bit 混合量化压缩到 440MB,可以在高通骁龙 865 等中阶手机芯片上实时推理。

支持范围:33 种语言 + 5 种方言 / 民汉语 + 1056 个翻译方向。FLORES-200 评测超越 Google 翻译等主流系统,翻译质量「对齐 235B 级大模型」。国际机器翻译比赛拿下 30 个第一名。

端上含义:纯离线本地推理 — 翻译内容不上传云端、不收集个人信息。对企业客户(法律、金融、医疗文件翻译)是可导入的关键 — 云端 API 翻译一直卡在合规问题,本地模型直接消除整个风险面。

腾讯内部已落地:元宝、腾讯会议、企业微信、QQ 浏览器都接了这个模型,用在后台取词、邮件查阅、客服翻译等场景。权重 + 程序代码放 Hugging Face 与魔搭社区,开发者可以直接拉下来嵌进自己的 app。

对中文圈开发者来说,这代表多语言 app 的翻译层终于可以离开 Google Translate / DeepL 的云端 API,变成自己掌控的端上组件。对隐私要求高的市场(欧洲企业、医疗),这也是中国模型第一次提供有竞争力的离线方案。