每日精选 · DAILY DIGEST

AI 资讯· news

我们从全球信息源中筛选,只把真正重要的发布、研究与产业动向交到你面前。

订阅每日邮件
共 100 篇· 4 / 共 13
06
6月
趋势·来源 · arxiv.org·2026/06/06

个人AI代理用于相册视觉问答的研究

一项研究探索了利用个人AI代理对用户相册进行视觉问答,使会话式AI助手能够访问并检索相关图像。

06
6月
AI·来源 · blog.google·2026/06/06

Gemma 4 QAT 模型:优化压缩以提高移动和笔记本电脑效率

Google推出了Gemma 4的量化感知训练(QAT)模型,旨在通过优化压缩来提高在移动设备和笔记本电脑上的运行效率。

06
6月
趋势·来源 · www.reddit.com·2026/06/06

Unsloth 发布 Gemma 4 的 MTP GGUF 权重,支持多尺寸量化版本

Unsloth已经发布了针对Gemma 4模型的MTP GGUF权重,包括31B、26B-A4B和12B等不同规模的Q8、F16和BF16量化版本。

06
6月
趋势·来源 · www.reddit.com·2026/06/06

TinyTPU:SystemVerilog脉动阵列编译为WASM并在浏览器中运行

TinyTPU是一个使用SystemVerilog实现的4x4脉动阵列,可编译为WASM并在浏览器中实时运行,其RTL经过numpy验证。

06
6月
趋势·来源 · arxiv.org·2026/06/06

研究分析秘密LLM代理在实验中的劝说策略

一项研究分析了Reddit上一个已中止的现场实验中,秘密大型语言模型(LLM)代理所使用的劝说策略。

06
6月
趋势·来源 · arxiv.org·2026/06/06

模型崩溃的流行病学研究:通过双层SIR动力学模拟合成数据污染

一项研究通过双层SIR动力学模型来分析合成数据污染如何导致模型崩溃,揭示了AI生态系统中的交叉污染问题。

05
6月
重点·来源 · github.com·2026/06/05

llama.cpp CUDA性能显著提升,MTP吞吐量增强

llama.cpp 更新 (b9521) 显著优化了其CUDA实现,特别是通过将 `mul_mat_vec_q_moe` 操作纳入PDL,大幅提高了MTP(多线程处理)的性能。

05
6月
趋势·来源 · www.reddit.com·2026/06/05

Reddit r/MachineLearning 版块每月项目自荐帖再次开启

Reddit r/MachineLearning 社区定期开放自荐帖,允许用户发布个人项目、创业公司、产品、协作需求和博客等,并明确提及付费和定价信息。