蚂蚁集团联合清华大学发布开源强化学习训练框架 AReaL v1.0 稳定版
来自:www.oschina.net 收录时间:2026-03-04
3月4日,蚂蚁集团联合清华大学发布开源强化学习训练框架AReaL v1.0稳定版。该版本主打“Agent一键接入RL训练”:不用改代码,兼容各类Agent框架,让智能体强化学习训练开箱即用。 AReaL是首个全异步训推解耦的大模型强化学习训练系统,能让 Agent 在真实任务交互中获得反馈、持续优化决策。此次发布的v1.0版本让任意Age...
阅读更多