技术文摘 - 程序员工具箱

清华联手上海 AI Lab 发布开源 SimpleVLA-RL 框架

来自：www.oschina.net 收录时间：2025-09-16

清华联手上海AI Lab组建的PRIME-RL团队发布SimpleVLA-RL，这是一个基于强化学习扩展Vision-Language-Action模型训练的轻量框架。项目受DeepSeek-R1启发，仅用0/1规则奖励即可在仿真环境中完成在线RL，显著提升长时规划能力并超越监督微调基线。该框架利用强化学习扩展视觉-语言-动作模型的训练，有效提升了模型的长时规...

阅读更多