9月28日,全球最大AI开源社区Hugging Face发布最新模型榜单,阿里通义大模型家族表现抢眼,7款模型同时入选全球开源模型前十名,创下业界新纪录。其中,刚刚开源的全模态大模型Qwen3-Omni凭借卓越性能荣登榜首。
Qwen3-Omni作为阿里最新开源的全模态模型,在音频和视频处理领域表现尤为突出,共获得32项开源最佳性能SOTA。该模型能够同时处理文本、图像、语音和视频四种数据类型,实现了类似人类的”听、说、写”多模态交互能力。
值得关注的是,Qwen3-Omni在保持强大音视频处理能力的同时,单模态文本与图像性能依然稳定,这在业内尚属首次。这一突破意味着过去需要多个模型协同完成的复杂任务,现在仅需Qwen3-Omni单个模型即可实现,显著提升了AI交互体验。该技术未来可广泛应用于车载系统、智能眼镜和移动设备等场景。
在近日举行的2025云栖大会上,阿里连续发布7款模型引发全球关注。除Qwen3-Omni外,通义大模型家族中的视觉理解模型Qwen3-VL、图像编辑模型Qwen-Image-Edit-2509、动作生成模型Wan2.2-Animate以及深度研究Agent模型DeepResearch等6款不同规格的模型均跻身榜单前十。
截至目前,阿里通义已累计开源300余个模型,覆盖全模态和全尺寸类型,全球下载量突破6亿次,衍生模型数量超过17万个,稳居全球首位。这一成绩不仅彰显了阿里在AI开源领域的领先地位,也为全球开发者提供了丰富的技术选择。