大模型优秀大脑齐聚硬核开源聚会,SGLang社区举办国内首次Meetup

[复制链接]
周大 发表于 2025-10-28 15:18:28 | 显示全部楼层 |阅读模式
SGLang 于2025年10月25日联合美团、亚马逊云科技在北京举办国内首场官方 Meetup,展示其作为高性能开源大模型推理引擎的技术进展与广泛应用。该平台支持 Llama、Qwen、DeepSeek 等主流模型,在 NVIDIA、华为昇腾等多种硬件运行,全球已服务超30万块 GPU。会上披露了 KV Cache 分层缓存、FP4 量化、Specforge 投机采样框架(显存节省10–20倍)等关键技术突破,并分享了在百度搜索、微信搜一搜、华为 NPU 及医疗 AI 等场景的落地实践,体现了其在推理效率、跨平台兼容性与生态整合方面的持续创新。
来源:https://mp.weixin.qq.com/s/Rjo7kpZkMbW7HeI3MoRMSw

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-11-9 06:21 , Processed in 0.296492 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表