潜潜龙QianLong
首页AI 教程AI 资讯AI 应用GitHub 高星项目深度专栏价格
每日精选 · DAILY DIGEST

AI 资讯· news

我们从全球信息源中筛选,只把真正重要的发布、研究与产业动向交到你面前。

订阅每日邮件
全部重点搞钱趋势
共 41 篇·第 6 / 共 6 页
05
6月
趋势·来源 · www.reddit.com·2026/06/05

华为开源 KVarN:新型 KV-缓存量化方法,VLLM可一键启用

Reddit r/LocalLLaMA 社区讨论了华为开源的新型KV-缓存量化方法 KVarN (Variance-Normalized KV-Cache Quantization)。该方法实现了3-5倍的KV缓存压缩,同时在推理速度上有所提升,并在推理能力上表现稳健,支持 Apache 2.0 许...

华为开源 KVarN:新型 KV-缓存量化方法,VLLM可一键启用
上一页1...56
潜
潜龙QianLong

潜龙在渊,待时而动。为中文读者精选的 AI 内容与工具平台。

订阅每周精选
内容板块
首页AI 教程AI 资讯AI 应用GitHub 高星项目深度专栏价格
公司
联系我们AI 应用价格
法律
隐私政策服务条款
潛龍© 2026 QianLong Online
qián lóng yǒng yú yuān