蚂蚁开源万亿参数思考模型Ring-1T，数学推理能力达国际奥赛银牌水平

蚂蚁集团近日正式发布并开源了万亿参数思考模型Ring-1T，这一突破性进展在多项基准测试中展现出接近GPT-5的卓越性能。该模型不仅全面开放了模型权重和训练配方，更在复杂推理任务上实现了重大突破。

在数学推理能力测试中，Ring-1T的表现尤为亮眼。研究团队采用IMO2025国际数学奥林匹克竞赛题目进行验证，结果显示模型仅用一次尝试就成功解出第1、3、4、5题，达到IMO银牌水平，成为首个能够获得国际奥数奖项的开源系统。即使在难度极高的第六题上，Ring-1T也将答案收敛至与Gemini 2.5 Pro相同的”4048″，展现出强大的数学推理潜力。

在通用能力评估方面，Ring-1T在”人类偏好对齐”测试Arena-Hard V2中以81.59%的成功率位居开源模型榜首，与GPT-5-Thinking(High)的82.91%成绩相差无几。在专业医疗问答测试HealthBench中，该模型同样取得了开源领域的最佳成绩。

为解决万亿参数模型训练中的技术难题，蚂蚁研发团队开发了创新的”棒冰”算法。这项技术通过带掩码的双向截断方法，有效控制了训练与推理阶段的分布差异，确保了长序列训练的稳定性。同时，团队还自主研发了高性能强化学习系统ASystem，专门优化了万亿参数模型的显存管理和权重交换问题。

Ring-1T基于Ling 2.0架构的1T基础模型，采用了包括稀疏MoE架构、FP8混合精度在内的多项先进技术。通过多阶段训练策略，模型在复杂推理、指令跟随和创意写作等方面的能力得到显著提升。

目前，用户可通过HuggingFace和魔搭社区获取模型资源，并通过蚂蚁百宝箱平台在线体验。随着Ring-1T的发布，蚂蚁百灵大模型正式迈入2.0阶段，形成了从160亿到1万亿参数的全系列产品矩阵。

蚂蚁开源万亿参数思考模型Ring-1T，数学推理能力达国际奥赛银牌水平

相关文章

近期热门