推理加速
an archive of posts with this tag
| Jun 25, 2026 | SpecASR:ASR 专属 Speculative Decoding,让 LLM 语音识别快 3.79 倍 |
|---|---|
| Apr 26, 2026 | KVCOMM:让多 Agent 系统的 KV Cache 真正“通起来”,TTFT 直接砍掉 7.8 倍 |
an archive of posts with this tag
| Jun 25, 2026 | SpecASR:ASR 专属 Speculative Decoding,让 LLM 语音识别快 3.79 倍 |
|---|---|
| Apr 26, 2026 | KVCOMM:让多 Agent 系统的 KV Cache 真正“通起来”,TTFT 直接砍掉 7.8 倍 |