商汤开源空间智能模型SenseNova-SI，多项评测超越GPT-5和Gemini 2.5 Pro

商汤科技今日宣布在空间智能领域取得重大突破，正式开源SenseNova-SI系列模型。最新评测数据显示，该模型在空间理解和推理任务上不仅大幅领先同量级开源模型，更超越了GPT-5和Gemini 2.5 Pro等国际顶尖闭源模型。

当前主流大模型在知识、写作、编程等方面表现出色，但在空间结构理解上存在明显短板。举例来说，GPT-5能轻松解决复杂的图形推理题，却在选择立方体俯视图这类基础空间问题上出现错误。这凸显了空间智能已成为AI理解三维世界的关键瓶颈。

SenseNova-SI系列包含2B和8B两个版本，其中8B模型在VSI、MMSI、MindCube、ViewSpatial四个基准测试中平均得分达60.99，显著优于Qwen3-VL-8B（40.16）等开源模型，也超越了GPT-5（49.68）和Gemini 2.5 Pro（48.81）。这一突破性表现表明模型在空间智能上实现了质的飞跃。

技术突破的关键在于商汤提出的系统性训练方法。团队通过大规模高质量数据训练，首次在空间智能领域验证了“尺度效应”，使模型在空间测量、空间重构、视角转换等六大核心维度上获得全面提升。该训练范式具有通用性，可适配不同架构的基础模型。

在具体测试案例中，SenseNova-SI-8B在立方体俯视图选择、空间方位判断、车辆行为预测等多个场景中均给出正确答案，而GPT-5则出现多次误判。

空间智能是世界模型和具身智能理解物理世界的基础能力。SenseNova-SI与商汤此前发布的“开悟”世界模型相辅相成，将推动AI在自动驾驶、机器人等领域的应用落地。同时，商汤还开源了空间智能测评平台EASI，旨在建立统一的行业评估标准。

这一突破标志着AI在三维世界理解能力上迈出关键一步，为下一代通用人工智能融入物理世界奠定了坚实基础。

商汤开源空间智能模型SenseNova-SI，多项评测超越GPT-5和Gemini 2.5 Pro

相关文章

近期热门