清华联手上海 AI Lab 发布开源 SimpleVLA-RL 框架
来自:www.oschina.net 收录时间:2025-09-16
清华联手上海AI Lab组建的PRIME-RL团队发布SimpleVLA-RL,这是一个基于强化学习扩展Vision-Language-Action模型训练的轻量框架。 项目受DeepSeek-R1启发,仅用0/1规则奖励即可在仿真环境中完成在线RL,显著提升长时规划能力并超越监督微调基线。该框架利用强化学习扩展视觉-语言-动作模型的训练,有效提升了模型的长时规...
阅读更多