蚂蚁开源业内首个 100B 扩散语言模型 LLaDA2.0
来自:www.oschina.net 收录时间:2025-12-12
蚂蚁技术研究院宣布推出 LLaDA2.0 系列离散扩散大语言模型(dLLM),并同步公开了背后的技术报告,宣称是“业内首个 100B 扩散语言模型”。 LLaDA2.0 包含 MoE 架构的 16B (mini) 和 100B (flash) 两个版本,将 Diffusion 模型的参数规模首次扩展到了 100B 量级。据介绍,此次发布的模型不仅打破了扩散模型难以扩展的固有...
阅读更多