复旦大学与美团联合发布 R-HORIZON,长链推理评测框架
来自:www.oschina.net 收录时间:2025-10-29
复旦大学与美团LongCat联合推出 R-HORIZON——首个系统性评估与增强 LRMs 长链推理能力的评测框架与训练方法。 据介绍,R-HORIZON 提出了问题组合(Query Composition)方法,通过构建问题间的依赖关系,将孤立任务转化为复杂的多步骤推理链。 以数学任务为例,该方法包含三个步骤: 1. 信息提取:从独立问题中提取核心数...
阅读更多