系统优化
an archive of posts with this tag
| May 17, 2026 | KDD'25 | BurstGPT:我们收集了 1031 万条 Azure OpenAI 真实 trace,LLM 推理系统没你想的那么稳 |
|---|---|
| May 14, 2026 | EuroSys'26 | KUNSERVE 把冗余参数副本临时让给 KVCache,P99 TTFT 最快降 72× |
| May 14, 2026 | KV Cache 的两层存储到底卡在哪?FAST'26 这篇论文给出了答案 |
| May 12, 2026 | MoE 训练通信瓶颈有救了?DySHARP 直接在交换机里做计算,干掉 50% 冗余流量 |