小红书开源 Relax:面向全模态 Agentic 的异步 RL 训练引擎
来自:www.oschina.net 收录时间:2026-04-15
小红书 AI 平台团队宣布正式开源 Relax —— 一款面向全模态与 Agentic 场景设计的大模型强化学习训练引擎。 根据介绍,Relax 基于 Megatron-LM 和 SGLang 高性能后端构建,以协同设计为核心理念,将全模态数据支持、服务化容错架构和异步训练流水线三个维度统一解决。在 Qwen3-Omni-30B 上,Relax 验证了图像、文本、音...
阅读更多