#CUDA优化
SGLang 团队把工程经验写进 Agent:3 个 Kernel PR 合并,B200 加速 2.75x
Agent 辅助开发:SGLang 团队的工程实践
SGLang 团队最近做了一件有趣的事:把自家在 benchmarking、profiling、CUDA kernel 调优、生产问题排查等方面的工程经验,编码成可执行的 agent sk…