- formatting
- images
- links
- math
- code
- blockquotes
•
•
•
•
•
-
延迟降47%!FineMoE如何用「细粒度」打破MoE推理的显存-延迟死局
-
训练一个「会管技能库」的 AI——SkillOS 让 agent 真正越用越强
-
MoE 训练通信瓶颈有救了?DySHARP 直接在交换机里做计算,干掉 50% 冗余流量
-
2508_06526
-
NeurIPS24 | 把Dense LLM变身MoE还提速 - marsggbo
把 Dense LLM 变成 MoE 还能推理提速?NeurIPS 2024 Read-ME 做到了 原文:Read-ME: Refactorizing LLMs as Router-Decoupled Mixture of Experts with System Co-Design 1. 前言 做