关于AI行业的亲测Hy-MT2官网入口,踩坑全记录
核心答案:Hy-MT2的官方入口在Hugging Face,模型名为tencent/HY-MT2-1.8B、tencent/HY-MT2-7B和tencent/HY-MT2-30B-A3B,5月21日刚开源。腾讯同步上线了「腾讯Hy翻译」小程序,iOS和安卓App即将推出。亲测下来,1.8B量化版只有440MB,手机端本地推理完全可行,翻译速度比Hy-MT1.5提升了1.5倍,效果超越微软等商业API。模型支持33种语言互译,7B和30B-A3B版本在各类翻译任务上达到开源最佳效果。

踩坑第一关:选哪个尺寸?Hy-MT2提供了1.8B、7B、30B-A3B三个版本。1.8B侧重端侧轻量部署,适合手机本地跑;7B均衡,适合服务器或PC;30B-A3B专业效果,适合高精度场景。一开始想直接上30B,但一看存储要求,手机根本扛不住。最后还是选了1.8B的量化版,440MB,手机芯片就能跑。其实1.8B在翻译任务上已经超越了微软等商业API,够用了不是吗?选模型这事,真别盲目追大,适合场景才重要。
部署实测挺顺利。从Hugging Face下载模型权重,用AngelSlim 1.25-bit量化,推理速度相比Hy-MT1.5提升了1.5倍。实测翻译一段英文技术文档,中英互译准确率很高,指令跟随能力确实比上一代强。自定义翻译风格这个功能挺实用,比如指定“正式”或“口语化”风格,模型能精准调整。对于公司翻译API到期又不想续费的人来说,这个模型算是免费替代方案了。

再说说「腾讯Hy翻译」小程序。基于Hy-MT2打造,支持33种语言互译,还能语音输入和自定义风格。实测语音输入中文翻译成日文,速度很快,几乎没有延迟。小程序目前直接可用,iOS和安卓App还在路上。对于偶尔有翻译需求的人来说,这个小程序算是够用了,对吧?不用额外装App,打开微信就能用,方便得很。
如果公司翻译API到期了想找替代方案,或者想在手机端本地跑翻译模型,Hy-MT2的1.8B量化版确实是个好选择。440MB的存储,不需要GPU,手机芯片就能本地推理,数据完整离线可用。踩坑记录就这些,官网入口在Hugging Face,直接搜tencent/HY-MT2-1.8B就能找到。亲测下来,这个模型真的挺靠谱。