当前位置: 科技先知道 » 人工智能 » 蚂蚁开源万亿参数思考模型Ring-1T,数学推理能力达国际奥赛银牌水平

蚂蚁开源万亿参数思考模型Ring-1T,数学推理能力达国际奥赛银牌水平

蚂蚁集团近日正式发布并开源了万亿参数思考模型Ring-1T,这一突破性进展在多项基准测试中展现出接近GPT-5的卓越性能。该模型不仅全面开放了模型权重和训练配方,更在复杂推理任务上实现了重大突破。

在数学推理能力测试中,Ring-1T的表现尤为亮眼。研究团队采用IMO2025国际数学奥林匹克竞赛题目进行验证,结果显示模型仅用一次尝试就成功解出第1、3、4、5题,达到IMO银牌水平,成为首个能够获得国际奥数奖项的开源系统。即使在难度极高的第六题上,Ring-1T也将答案收敛至与Gemini 2.5 Pro相同的”4048″,展现出强大的数学推理潜力。

在通用能力评估方面,Ring-1T在”人类偏好对齐”测试Arena-Hard V2中以81.59%的成功率位居开源模型榜首,与GPT-5-Thinking(High)的82.91%成绩相差无几。在专业医疗问答测试HealthBench中,该模型同样取得了开源领域的最佳成绩。

为解决万亿参数模型训练中的技术难题,蚂蚁研发团队开发了创新的”棒冰”算法。这项技术通过带掩码的双向截断方法,有效控制了训练与推理阶段的分布差异,确保了长序列训练的稳定性。同时,团队还自主研发了高性能强化学习系统ASystem,专门优化了万亿参数模型的显存管理和权重交换问题。

Ring-1T基于Ling 2.0架构的1T基础模型,采用了包括稀疏MoE架构、FP8混合精度在内的多项先进技术。通过多阶段训练策略,模型在复杂推理、指令跟随和创意写作等方面的能力得到显著提升。

目前,用户可通过HuggingFace和魔搭社区获取模型资源,并通过蚂蚁百宝箱平台在线体验。随着Ring-1T的发布,蚂蚁百灵大模型正式迈入2.0阶段,形成了从160亿到1万亿参数的全系列产品矩阵。

未经允许不得转载:科技先知道 » 蚂蚁开源万亿参数思考模型Ring-1T,数学推理能力达国际奥赛银牌水平

相关文章

My title