新潮

阿里国际AI翻译模型Marco霸榜WMT机器翻译大赛最难赛道

近日,2025年国际机器翻译大赛WMT (Conference on Machine Translation) 宣布最终排名,阿里国际AI Business的翻译大模型Marco-MT-Algharb斩获6项冠军,4项亚军和2项季军。

其中,在最受关注的英中语向上,Marco-MT超越了Gemini 2.5 Pro、GPT-4.1、Claude 4和Mistral-Medium等所有顶尖闭源AI系统,登顶榜首。WMT的人工评测被视为机器翻译领域的“黄金标准”,这也标志着Marco-MT从电商行业翻译迈向通用翻译的领先行列。

31bf59c17bc240e0beee3c5527d554b1~tplv-obj.image?lk3s=ef143cfe&traceid=202510240944498FB872CB8E549E895C07&x-expires=2147483647&x-signature=s1QCuTf2MZC1nfBKVreuWlRGfAo%3D

作为全球机器翻译领域的顶级赛事,WMT2025吸引了Gemini 2.5 Pro、GPT-4.1、Claude 4、Mistral-Medium等主流闭源模型,以及DeepSeek-V3、Qwen3-235B、Llama-4-Maverick等领先开源模型同台竞技。

阿里国际的Marco-MT模型参加的是WMT竞赛中难度更高的受限赛道。相比于非受限赛道,受限赛道不仅要求模型能够处理文学、新闻、社交媒体等多样化内容,还需严格遵守仅使用开源数据和开源模型,且模型规模不超过20B的限制条件。

c10ecb1309ea47158a120c9d39efd3c0~tplv-obj.image?lk3s=ef143cfe&traceid=202510240944498FB872CB8E549E895C07&x-expires=2147483647&x-signature=vuF%2F8lQXH8JYJeCSDciZUK39wck%3D

Marco-MT此次脱颖而出,关键在于将丰富的电商翻译模型训练经验与一套原创训练方法M2PO(多阶段偏好优化)相结合,成功将强化学习范式应用于大模型翻译领域。该系统分三步提升翻译质量:先通过两轮监督微调拓宽知识基础;再引入强化学习,让模型学会判断译文优劣;最后在解码阶段融合词对齐与重排序技术,在保证流畅的同时精准还原原文,显著提升翻译的准确性和忠实度。

WMT被誉为机器翻译领域的“黄金标准”,其评测结果被全球学术界与工业界视为技术风向标。本届赛事采用COMET、LLM Judge等自动指标与大规模人工评测相结合的机制,最终排名以人工评分为准。Marco-MT在包括英译中在内的13个核心语向表现优异,跻身全球顶尖水平,标志着其通用翻译能力获得广泛认可。其中,在英译中等多个语向上,表现超过人工翻译。

据「TMT星球」了解,Marco-MT发布于2024年,最初专注于电商场景翻译,已接入阿里国际旗下的电商平台,支持搜索、商品信息、对话、图片等多种场景的翻译。跨文化、多语种的业务需求,使其具备高质量、低幻觉率等核心优势,为此次向通用翻译的拓展打下坚实基础。此前,Marco-MT已在语音翻译领域崭露头角,在2025年IWSLT国际赛事中斩获2项冠军和2项亚军,表现出机器翻译领域多模态的竞争力。

*如果大家有关于中泰信托吴庆斌、建华建材、深圳优制云工业互联网有限公司郑能欢、镇江市中级人民法院贾黛舒、句容市人民法院赵剑岚、南京市鼓楼人民法院刘桂占的相关新闻线索,欢迎联系我们,我们将联合其他媒体进行全球范围的重点报道。
海信冰箱・雨辰助学为沂南学校送教育助力
« 上一篇 10-25
荣耀“1×3×N”生态战略落地,打造千亿级终端集群
下一篇 » 10-25

相关内容

加速进化发布Booster K1,打造AI时代的苹果公司
淘宝出海上线家具直邮服务,双11预计全行业GMV两位数增长
快手进军AI Coding,开发工具、模型和Maas平台齐登场
电商行业首例!唯品会全面接入中国中检正品管理库