当前位置: 科技先知道 » 人工智能 » 商汤开源空间智能模型SenseNova-SI,多项评测超越GPT-5和Gemini 2.5 Pro

商汤开源空间智能模型SenseNova-SI,多项评测超越GPT-5和Gemini 2.5 Pro

商汤科技今日宣布在空间智能领域取得重大突破,正式开源SenseNova-SI系列模型。最新评测数据显示,该模型在空间理解和推理任务上不仅大幅领先同量级开源模型,更超越了GPT-5和Gemini 2.5 Pro等国际顶尖闭源模型。

当前主流大模型在知识、写作、编程等方面表现出色,但在空间结构理解上存在明显短板。举例来说,GPT-5能轻松解决复杂的图形推理题,却在选择立方体俯视图这类基础空间问题上出现错误。这凸显了空间智能已成为AI理解三维世界的关键瓶颈。

SenseNova-SI系列包含2B和8B两个版本,其中8B模型在VSI、MMSI、MindCube、ViewSpatial四个基准测试中平均得分达60.99,显著优于Qwen3-VL-8B(40.16)等开源模型,也超越了GPT-5(49.68)和Gemini 2.5 Pro(48.81)。这一突破性表现表明模型在空间智能上实现了质的飞跃。

技术突破的关键在于商汤提出的系统性训练方法。团队通过大规模高质量数据训练,首次在空间智能领域验证了“尺度效应”,使模型在空间测量、空间重构、视角转换等六大核心维度上获得全面提升。该训练范式具有通用性,可适配不同架构的基础模型。

在具体测试案例中,SenseNova-SI-8B在立方体俯视图选择、空间方位判断、车辆行为预测等多个场景中均给出正确答案,而GPT-5则出现多次误判。

空间智能是世界模型和具身智能理解物理世界的基础能力。SenseNova-SI与商汤此前发布的“开悟”世界模型相辅相成,将推动AI在自动驾驶、机器人等领域的应用落地。同时,商汤还开源了空间智能测评平台EASI,旨在建立统一的行业评估标准。

这一突破标志着AI在三维世界理解能力上迈出关键一步,为下一代通用人工智能融入物理世界奠定了坚实基础。

未经允许不得转载:科技先知道 » 商汤开源空间智能模型SenseNova-SI,多项评测超越GPT-5和Gemini 2.5 Pro

相关文章

My title