智谱推出 GLM-5.1 高速版:400 tokens/s
来自:www.oschina.net 收录时间:2026-05-22
智谱宣布面向部分企业客户提供 GLM-5.1 高速版 API“GLM-5.1-highspeed”。模型输出速度达到 400 tokens/s,适用于AI编程、实时交互、商业决策、实时语音等对响应延迟要求极高的场景。 公告称,GLM-5.1 高速版在完整保留 GLM-5.1 能力的基础上,第一次拥有“即问即答”的响应速度。 “这一速度意味着,一位写作者连续伏案...
阅读更多