05
6月
趋势·来源 · www.reddit.com·2026/06/05
华为开源 KVarN:新型 KV-缓存量化方法,VLLM可一键启用
Reddit r/LocalLLaMA 社区讨论了华为开源的新型KV-缓存量化方法 KVarN (Variance-Normalized KV-Cache Quantization)。该方法实现了3-5倍的KV缓存压缩,同时在推理速度上有所提升,并在推理能力上表现稳健,支持 Apache 2.0 许...
05
6月
搞钱·来源 · www.producthunt.com·2026/06/05
Product Hunt 发布 Mailwarm 2.0:升级的邮件预热工具,提升送达率
Mailwarm 2.0 在 Product Hunt 上发布,作为一款升级版的邮件预热工具,旨在显著提高邮件送达率。
05
6月
搞钱·来源 · www.producthunt.com·2026/06/05
Product Hunt 发布 Gather:信息收集与永久保存工具
Gather 在 Product Hunt 上发布,其核心功能是帮助用户一站式保存各类信息,并确保永不丢失。
04
6月
重点·来源 · x.com·2026/06/04
Google DeepMind 发布 Gemma 4 12B,支持笔记本电脑上高性能多模态
Google DeepMind 发布了 Gemma 4 12B,这是一款基于 Apache 2.0 许可证的统一、无编码器多模态模型,旨在直接在笔记本电脑上提供高性能AI。
04
6月
重点·来源 · x.com·2026/06/04
Mistral Vibe 发布,成为长周期生产力与编码AI代理
Mistral Vibe 正式发布,作为一个专注于长周期生产力与编码的AI代理,提供了工作模式、代码模式、命令行界面以及VS Code扩展。
04
6月
重点·来源 · x.com·2026/06/04
Mistral AI 推出 Connectors API 公开预览版,供开发者使用
Mistral AI 发布了 Connectors API 的公开预览版,使开发者能够一次性注册 MCP 连接器并在 Le Chat、AI Studio 和所有编程工具调用中重复使用。
04
6月
重点·来源 · x.com·2026/06/04
Anthropic 收购 StainlessAPI,后者是其SDK和MCP服务器平台提供商
Anthropic 正在收购 StainlessAPI,该公司自 Anthropic API 早期就一直为其所有 SDK 提供支持的 SDK 和 MCP 服务器平台。
04
6月
重点·来源 · developers.google.com·2026/06/04
Gemini Code Assist 推出 Gemini 2.5 Pro 和 Flash 模型,并新增多项功能
Gemini Code Assist 已正式发布 Gemini 2.5 Pro 和 Flash 模型,并新增了面向 VS Code 的代理模式、改进的聊天代码建议以及AI排除文件配置等功能。