台北市网站建设_网站建设公司_一站式建站_seo优化-江西省网站建设公司

千寻智能新近开源的视觉语言动作模型Spirit v1.5，成为具身智能领域的新爆点。它不是又一个关在源码里的Demo，而是真正通过实机测试、榜单排名与社区反馈证明可用性的模型。

在RoboChallenge基准上，Spirit v1.5在综合能力上获得第一，打破了多模态AI在真实机器人调度上的落地瓶颈。相比之下，许多热门模型只在模拟器中演示漂亮动作，一旦换到真实空间就频频失效。

Spirit v1.5采用端到端统一架构，整合视觉语言输入与动作输出。这点尤为关键。目前大多数行动智能模型仍依赖针对任务的调度模块，很难适应真实环境中突发任务。

千寻的做法是用长周期开放式交互数据训练模型，让它从真实中学到上下文之间的模糊性和容错策略。换句话说，它非但没怕脏数据，反而拿这些“杂讯”构建出鲁棒性更强的交互策略。这是大多数纯净模拟训练方法所无法比拟的。

千寻智能同步放出了模型权重、核心代码和完整评测流程。当前许多开源项目只是形式化走个流程，但无评测标准、无官方环境配置，经常复现实验都成了编译难题。

Spirit v1.5的这一发布方式改变了这一状况。它不仅提供直接可复现的数据和环境，还引入了对表现结果的统一度量方式。社区开发者可以快速验证模型表现，并构建改进版本，这对推动具身智能成为工程化产品极为关键。

令人意外的是，Spirit v1.5并不是一个庞然大物。其模型参数远低于许多视觉语言大模型，但却展示出更强的执行能力。

这打破了一种惯性思维——具身智能一定要靠超大模型才能包打天下。事实证明，动作合理性和对环境变化的快速建模能力，比单纯追求多模态理解更影响机器人在现实中的可用性。

平台 GitHub

项目：https://github.com/QianxunAI/Spirit-v1.5

台北市网站建设_网站建设公司_一站式建站_seo优化