秘塔AI搜索推出全新“极速”模型,响应速度最高400 tokens/秒
来自:www.oschina.net 收录时间:2025-05-28
秘塔AI搜索推出了全新“极速”模型,新版模型不仅更快,准确率更高,逻辑也更清晰。 据介绍,秘塔AI团队通过在GPU上进行kernel fusion,以及在CPU上进行动态编译优化,在单张H800 GPU上实现了最高400 tokens/秒的响应速度,大部分问题2秒内就能答完。 用户可通过测速站点kuai.metaso.cn体验实际效果,但团队提示模型规模...
阅读更多