TODAY · 今日 AI
智譜揭 GLM-5 降智真相:KV Cache 競態惹的禍
智譜每天有上億次 GLM-5 Coding Agent 呼叫,高併發下出現亂碼、重複生成、生僻字三類異常,被用戶解讀成「模型降智」。內部發現是兩個系統級問題:PD 分離架構下 KV Cache 競態、HiCache 載入時序缺失。修完後異常率從每萬次 10 多次降到 3 次以下。智譜公開復盤的訊息很有意思——大模型上規模需要的不只是 Scaling Law,還有等量級的系統工程。
發佈日期: 2026-05-04
來源
- 量子位 — 智谱公布「降智」的秘密zh-CN
標籤
zhipuinfrastructurecoding-agentkv-cache