跳到内容

TODAY · 今日 AI

智谱揭 GLM-5 降智真相:KV Cache 竞态惹的祸

智谱每天有上亿次 GLM-5 Coding Agent 调用,高并发下出现乱码、重复生成、生僻字三类异常,被用户解读成「模型降智」。内部发现是两个系统级问题:PD 分离架构下 KV Cache 竞态、HiCache 加载时序缺失。修完后异常率从每万次 10 多次降到 3 次以下。智谱公开复盘的信息很有意思——大模型上规模需要的不只是 Scaling Law,还有等量级的系统工程。

发布日期: 2026-05-04
登入以收藏

来源

标签

zhipuinfrastructurecoding-agentkv-cache

We use cookies

Anonymous analytics help us improve the site. You can opt out anytime. Learn more