Xin HE's Website

Share papers, techniques, and wonderful life

LLMRouterBench：当所有 routing 方法被拉到同一起跑线，结果有些尴尬

4 min read · May 19, 2026

2026 · LLM Routing Benchmark 论文解读
LLM Agent Memory 全景拆解：从 RAG 到 KV Cache 到参数写入，100+ 篇工作的方法演进与真实取舍

6 min read · May 19, 2026

2026 · LLM Agent Memory KV Cache RAG 论文解读
EuroSys'26 | TokenFlow：让 LLM 流式输出真正「流」起来

3 min read · May 17, 2026

2026 · LLM Serving Preemptive Scheduling KV Cache Streaming EuroSys · LLM Inference System
AAAI'23 | NAS-LID：用「局部内在维度」给超网做体检，省 86% 显存

3 min read · May 17, 2026

2026 · NAS 神经架构搜索 AutoML One-shot NAS 论文解读
ICLR'26 Workshop Spotlight | Lang-PINN：让 LLM 多智能体帮你从自然语言一键搭建物理信息神经网络

3 min read · May 17, 2026

2026 · PINN LLM Agent 科学计算论文解读