技术文摘 - 程序员工具箱

智谱推出 GLM-5.1 高速版：400 tokens/s

来自：www.oschina.net 收录时间：2026-05-22

智谱宣布面向部分企业客户提供 GLM-5.1 高速版 API“GLM-5.1-highspeed”。模型输出速度达到 400 tokens/s，适用于AI编程、实时交互、商业决策、实时语音等对响应延迟要求极高的场景。公告称，GLM-5.1 高速版在完整保留 GLM-5.1 能力的基础上，第一次拥有“即问即答”的响应速度。 “这一速度意味着，一位写作者连续伏案...

阅读更多