每日精选 · DAILY DIGEST

AI 资讯· news

我们从全球信息源中筛选，只把真正重要的发布、研究与产业动向交到你面前。

共 41 篇·第 6 / 共 6 页

趋势·来源 · www.reddit.com·2026/06/05

华为开源 KVarN：新型 KV-缓存量化方法，VLLM可一键启用

Reddit r/LocalLLaMA 社区讨论了华为开源的新型KV-缓存量化方法 KVarN (Variance-Normalized KV-Cache Quantization)。该方法实现了3-5倍的KV缓存压缩，同时在推理速度上有所提升，并在推理能力上表现稳健，支持 Apache 2.0 许...