GitHub 高星项目/lightseekorg/smg
lightseekorg/

引擎无关的 LLM 网关

SMG 是一个用 Rust 编写的、与推理引擎无关的 LLM 网关。它不仅提供了对 OpenAI 和 Anthropic API 的全面兼容,还能无缝对接 SGLang、vLLM、TRT-LLM 等多种底层推理框架。项目还引入了 gRPC 管道、感知 KV 缓存的路由、WASM 插件以及 MCP 支持。 真正难的地方不是做一层简单的 API 转发,而是如何在多模型、多引擎的复杂环境下,实现高效的流量调度和状态管理。SMG 试图通过感知 KV 缓存的路由和分词缓存等底层优化,来榨干推理集群的性能。 对于需要管理大规模 LLM 推理服务的企业来说,这种高性能的中间件正变得越来越重要。它不仅解决了多模型接入的繁琐问题,还在性能优化上给出了相当硬核的方案。

Rust高潜项目潜龙编辑甄选
★ Stars
299
GitHub stars
⑂ Forks
84
Forked repos
⊙ Rank
No. 17
Editor rank
Activity
活跃
发布于 2026-05-29T21:11:16.000Z
编辑评介README快速上手Releases
潜龙评分
4.6/ 5.0
代码质量4.7
文档完善4.5
社区活跃4.4
上手难度4.2

引擎无关的 LLM 网关 最值得关注的地方,是它围绕真实开发场景提供了清晰的工程入口。SMG 是一个用 Rust 编写的、与推理引擎无关的 LLM 网关。它不仅提供了对 OpenAI 和 Anthropic API 的全面兼容,还能无缝对接 SGLang、vLLM、TRT-LLM 等多种底层推理框架。项目还引入了 gRPC 管道、感知 KV 缓存的路由、WASM 插件以及 MCP 支持。 真正难的地方不是做一层简单的 API 转发,而是如何在...

优点
+主题明确,便于快速判断适用场景
+社区关注度高,持续维护概率更大
+可作为同类技术选型的参考样本
不足
-具体成熟度仍需结合 README 与 issue 验证
-生产接入前需要自行评估许可与维护节奏

适用场景

如果你正在评估 高潜项目 方向,这个项目适合放入候选清单。它的 Star、Fork 与主题信息能够帮助你快速判断社区热度,再结合官方仓库文档进行技术验证。

潜龙 QianLong · 中文 AI 内容与工具平台