技术文摘 - 程序员工具箱

DistilQwen2.5-R1 发布：知识蒸馏助推小模型深度思考

来自：my.oschina.net 收录时间：2025-03-26

DistilQwen2.5-R1 系列以少量来自 DeepSeek-R1 的思维链蒸馏数据为基础，通过一系列创新的蒸馏策略，有效强化了小模型的深度思考能力。实验评估结果显示，DistilQwen2.5-R1 系列中的多种小规模模型在各项基准测试中表现优异（见下图）。例如，DistilQwen2.5-R1-7B 性能显著超越了其他开源蒸馏模型，包括 OpenThinker-7B...

阅读更多